Колибри, пуснато на свобода

Колибри, пуснато на свобода

Колибри, пуснато на свобода. Превод на статията Hummingbird Unleashed от Джанлука Фиорeли (Gianluca Fiorelli), публикувана за първи път на 24 октомври, 2013 г. в MOZ.

Публикацията ще бъде представена в две части:

I част:

Колибри, пуснато на свобода
Защо Амит Сингал смесва несравними неща?
Как работи Колибри?

II част:

90% от търсенията са засегнати, сериозно?
Ако Колибри е превключване към семантично SEO, означава ли това, че ако ползвам Schema.org, сайтът ми ще се позиционира по-добре?
Има ли връзка Колибри с увеличеното присъствие на Графа на знанието и картите с отговори?
Предимно на базата със знания ли се основава Колибри?
Колибри означава ли край на графа с връзки?
Има ли връзка между Колибри и 100% (not provided)?
Какво трябва да правим, за да се харесаме на Колибри?

Колибри, пуснато на свобода

Понякога си мисля, че ние, SEO специалистите, бихме могли да сме чудесни герои за филм на Уди Алън: стресирани сме, нервни, параноични, имаме склонността рязко да променяме настроението си … добре, де, може би преувеличавам малко, но обикновено така реагираме (прекомерно), всеки път, когато Google обяви нещо.

Hummingbird Unleashed

Случаи като този уеб администратор, който отчаяно мисли, че е бил наказан от Колибри, не са рядкост.

Едно от нещата, които не помагат, е липсата на яснота от страна на Google, които не само че не споменават Колибри в никой официален документ (например в публикацията по случай 15-тата им годишнина), но дори и се разграничиха от подробностите за тази епохална актуализация в неофициалните изявления на Амит Сингал (Amit Singhal). Всъщност, по един или друг начин, тези изявления частично допринесоха за объркването.

Когато от Google обявяват ъпдейт, особено такъв като Колибри, най-доброто нещо, което трябва да се направи, е да се избягват опитите веднага да се разбере какво представлява ъпдейтът единствено въз основа на интуиция. По-добре е да се изчака, докато прахта падне на земята, да се открият оригиналните документи, да се изследват и тези, свързани с тях (както и всякакви варианти), да се изчака, за да се види ъпдейта в действие, спокойно да се проучи и после, след всичко това, да се направи опит да се намерят най-достоверните отговори.

Този метод не е научен (и следователно отговорите не могат да бъдат определени като “със сигурност верни”), той е филологически, а когато стане дума за Google и техните ъпдейти, смятам, че това е един много добър метод за ползване.

Оригиналните документи са историята на събитието, по време на което Google обяви Колибри, както и Често задавани въпроси и отговори от Дани Съливан (Danny Sullivan), публикувани непосредствено след събитието, което директно отнася към това, което Амит Сингал каза.

Документите, отнасящи се към това, са патентите, които вероятно лежат в основата на Колибри и наблюденията, които експерти като Бил Славски (Bill Slawski), Амон Джонс (Ammon Johns), Ранд Фишкин (Rand Fishkin), Аарон Брадли (Aaron Bradley) и други представиха.

Тази публикация е резултатът от изучаването ми на тези документи и от теренни наблюдения.

Защо Амит Сингал смесва несравними неща?

Когато обявяваше Колибри, Амит Сингал каза, че Google алгоритъмът не е бил обновяван така из основи от времето, когато е бил пуснат ъпдейтът Кофеин през 2010 г.

Проблемът е, че Кофеин не беше алгоритмична промяна, той бе промяна в инфраструктурата.

Целта на Кофеин в действителност беше да оптимизира индексирането на милиардите интернет документи, които Google обхожда, представяйки по-богат, по-голям и по-актуален сбор от резултати на потребителите.

На свой ред, Колибри няма за цел по-нова оптимизация на процеса по индексиране, а се стреми към по-добро разбиране на намерението на потребителите при търсене, като в тази връзка им представя най-релевантните (подходящи) резултати.

Въпреки всичко, можем да потвърдим, че Колибри е също така и инфраструктурна актуализация, тъй като управлява повече от 200 елемента, които съставляват алгоритъма на Google.

Amit Singhal

Асоциацията, която Амит Сингал направи (може би подсъзнателно) между Кофеин и Колибри би трябвало да ни говори, че :

Колибри нямаше да съществува, ако Кофеин не бе пуснат през 2010 г. Оттук и това, че Колибри трябва да бъде схващано като еволюция на търсенето в Google, а не като революция.

Нещо повече, Колибри трябва да се мисли като най-амбициозния опит на Google да реши всички алгоритмични проблеми, причинени от Кофеин.

Нека обясня последната представена точка. Кофеин, излизайки от т.нар. “Sand Box”, стана причина за това страниците с резултати от търсенето да бъдат наводнени с нискокачествени резултати.

Google реагира на това като създаде допълнения (англ. patches) като ъпдейтите Панда, Пингвин и EMD (домейн с точно съвпадение на ключовата дума).

Но тези ъпдейти, толкова ефективни по отношение на това, което определяме като средноконкурентни и висококонкурентни заявки (middle- and head-tail queries), не бяха толкова ефективни за един вид заявка, който все повече хора започнаха да използват, най-вече поради бързото възприемане на мобилното търсене. Става дума за разговорните (диалогични) нискоконкурентни заявки или тези, които Амит Сингал определи като “многословни заявки” (англ. verbose queries).

Еволюцията в разпознаването на естествения език от Google, подобрената способност да се избягва двусмислието при дадени обекти (entities) и концепции чрез технология, наследена от Metaweb и подобрена чрез Графа на знанието (Knowledge Graph), както и огромните подобрения, направени в персонализираното показване на SERP, дадоха на Google теоритичните и практически инструменти не само да решават проблема с нискоконкурентните заявки, но и да дадат ново начало на еволюцията в търсенето на Google.

Това е предисторията, която обяснява какво разказа Амит Сингал за Колибри, преразказана тук от Дани Съливан (Danny Sullivan):
[Колибри] ни даде възможност […] да вземам синонимите, графа на знанието и други неща, с които Google се занимава, и да преосмислим как можем да използваме силата на всички тези неща, за да съчетаем значенията и да предскажем как да направим така, че заявката ви да съвпадне с документа, по отношение на това какво в действителност търси тази заявка, както и на това налични ли са връзките в документите. И не просто случайни съвпадения, каквито имаше в началото на търсачки.

Как работи Колибри?

“да вземам синонимите, графа на знанието и други неща, с които Google се занимава … ”

Google работи със синоними от дълго време насам. Ако се вгледаме в графиката, която от Google споделиха в публикацията си, посветена на техния 15-годишен юбилей, ще видим, че те се използват от 2002 г., въпреки че можем също да видим, че справянето с нееднозначността (англ. disambiguation), замислено като ортографичен анализ на заявките, се прилага от 2001 година.

How does Hummingbird work?

Миналата година Ванеса Фокс (Vanessa Fox) написа “Is Google’s Synonym Matching Increasing?…” в Search Engine Land.

Четейки този пост и гледайки представените примери, е ясно, че синонимите вече са били в употреба от Google – във връзка с намерението на потребителя, което стои зад заявката – с цел увеличаване на обхвата на заявката и пренаписването й, за да предостави най-добрите резултати на потребителите.

Същата тази публикация обаче, ни показва защо единствено използването на синонимен речник или разчитането на знание на заявки, които се позиционират високо, не е достатъчно, за да се осигури релевантен SERP. (Забележете как Ванеса посочва, че Google не смята “кучета” за домашни любимци в заявката “осиновяване на домашни любимци”, но пък взема предвид “котки”).

В този стар патент, Амит Сингал, също е наясно, че разчитането единствено на синоними не е перфектното решение, защото две думи могат да са синоними, но могат и да не са, в зависимост от контекста, в който са използвани (т.e. “coche” и “automóvil” – и двете означават кола на испански, но “carro” означава кола единствено на латиноамерикански испански, в същото време значейки “вагон” в Испания) .

Ето защо, за да предостави най-добрите възможни резултати с помощта на семантичното търсене, това, което Google трябваше да разбере по-добре, по-лесно и по-бързо, бе контекстът. Колибри е начинът, по който Google задоволи тази нужда.

Hummingbird is how Google solved that need

Синонимите остават от съществено значение. Амит Сингал потвърди това в разговор с Дани Съливан след събитието. Как те биват използвани сега е описано от Бил Славски в тази публикация, където той прави дисекция на патента за идентифициране на синоними на базата на появяващи се заедно (съпътстващи) изрази – Synonym identification based on co-occurring terms.

Този патент тогава също се основава на концепцията “search entities,” (обекти на търсенето), която описах в последната си публикация тук в Moz, когато говорих за персонализираното търсене.

Буквално, думите не са неща сами по себе си, а са вербална репрезентация (словесно представяне) на нещата. А обектите на търсенето (англ. search entities) са начинът, по който Google обективира думите в понятия. Един обект може да има взаимовръзки с други, които могат да се променят в зависимост от контекста, в който са използвани заедно. В този смисъл, думите биват третирани като хора, градове, книги и всякакви други, наричани образувания/обекти (entities) и обикновено свързани с графа на знанието.

Механизмите, които Google използва за идентифициране на обектите на търсенето, са особено важни при отстраняване на многозначността на различните потенциални значения на една дума, чрез което отстраняване се извършва и прецизното нагласяне на извличането на информацията, в съответствие с “probability score.”

Тази техника не е толкова по-различна от това, което Графът на знанието прави, когато елиминира многозначността. Например, апостолът Свети Петър от базиликата Свети Петър от града Свети Петър в Минесота.

И накрая, има и трета концепция, която играе важна роля в това какво би могъл да представлява патентът Колибри: съвместната поява/наличие (co-occurrences)

Интегрирайки тези три елемента, сега Google (на теория) могат:

1. Да разбират по-добре намерението на заявката;
2. Да увеличат обхвата на сбора от уеб документи, които биха могли да отговорят на заявката.
3. Да опростят начина, по който се доставя информация. Защото ако заявка А, заявка B и заявка C по същество означават едно и също, няма да е необходимо Google да предложи три различни SERP, а само един.

4. Да предложат по-добър опит по време на търсене. Защото, разширявайки заявката и по-добре разбирайки взаимовръзките между обектите на търсене (също така на базата на директни и индиректни елементи за персонализация), Google вече може да предложи резултати, за които има по-голяма вероятност да задоволят нуждите на потребителя .
5. В резултат на това, Google може да представи по-добри SERP също и по отношение на по-добри реклами, защото в 99% от случаите, при многословните заявки не бяха представяни реклами в SERP преди Колибри.

Може би Колибри щеше да разреши проблемите на Фред Астер и Джинджър Роджърс с говоренето…

Следва продължение …

Google+ коментари

Коментари