Tutto su Google Hummingbird

Hummingbird Scatenato

googlehummingbA volte penso che noi SEO potremmo essere degli splendidi soggetti per un film di Woody Allen: siamo stressati, nervosi, paranoici, abbiamo la tendenza a repentini cambiamenti di umore…ok, forse sto esagerando, ma è così che tendiamo a reagire ogni volta che Google annuncia qualcosa.

Situazioni come quella di questo webmaster  che pensa con disperazione di essere stato penalizzato da Hummingbird, non sono insolite.

Una cosa che certo non aiuta e’ la mancanza di chiarezza da parte di Google, che non solo non menziona mai Hummingbird nei suoi documenti ufficiali, ma non e’ neanche sceso nei dettagli di questo aggiornamento epocale nelle dichiarazioni ‘non ufficiali’ rese da Amit Singhal. Infatti, in un certo senso, tali dichiarazioni hanno contribuito alla confusione.

Quando Google annuncia un aggiornamento, specialmente uno come Hummingbird, la  miglior cosa da fare e’ evitare di cercare di capire immediatamente di cosa si tratta basandosi unicamente sull’intuito. E’ meglio aspettare che le cose sedimentino, andare a recuperare i documenti originali, esaminare quelli collegati (e le loro varianti), prendersi il tempo per vedere l’aggiornamento all’opera, esaminare con calma e, solo dopo, cercare di trovare le risposte più plausibili.

Questo non e’ un metodo scientifico (d’altronde le risposte non possono essere definite come “sicuramente corrette”) ma filologico e, quando si tratta di Google e suoi aggiornamenti, lo considero un ottimo metodo da usare.

I documenti originali sono la copertura stampa dell’evento  in occasione del 15mo compleanno di google durante il quale è stato presentato Hummingbird e le FAQ che Danny Sullivan pubblicò immediatamente dopo l’evento e che fanno riferimento a quanto detto da Amit Singhal. Documenti correlati sono invece i brevetti che probabilmente sono alla base di Hummingbird e le osservazioni che esperti come Bill Slawski, Ammon Johns, Rand Fishkin, Aaron Bradley e altri ne hanno tratto.

Questo post e’ il risultato del mio studio di tali documenti e osservazioni sul campo.

Perche’ Amit Singhal ha mescolato
mele con arance?

Mentre annunciava Hummingbird, Amit Singhal disse che era dall’epoca di Caffeine, nel 2010, che l’Algoritmo di Google non era aggiornato così a fondo. Il problema e’ che Caffeine non e’ stato un cambiamento nell’algoritmo, ma un cambiamento infrastrutturale.

Lo scopo di Caffeine era infatti di ottimizzare l’indicizzazione di miliardi di documenti Internet che Google scansiona, presentando un più ricco, consistente e fresco pool di risultati per gli utenti.

L’obiettivo di Hummingbird non e’ invece quello di ottimizzare il processo di indicizzazione ma quello di capire meglio gli intenti degli utenti quando fanno una ricerca, al fine di offrire loro i risultati più rilevanti.

Possiamo tuttavia affermare che Hummingbird e’ anche un aggiornamento infrastrutturale poiché controlla gli oltre 200 elementi che compongono l’algoritmo di Google.

La (forse inconscia) associazione che Amit Singhal ha creato tra Caffeine e Hummingbird dovrebbe  indicarci che:

  • Hummingbird non ci sarebbe se Caffeine non fosse stato messo in campo nel 2010 e perciò dovrebbe essere considerato un’evoluzione e non una rivoluzione di Google Search
  • Inoltre Hummingbird dovrebbe essere considerato il più ambizioso tentativo di Google di risolvere tutti i problemi algoritmici causati da Caffeine.

Spiego quest’ultimo punto. Caffeine, abbandonando la cosiddetta “Sand-Box”, ha fatto sì che la SERP venisse inondata da risultati di bassa qualità.

Google ha reagito creando dei patches come Panda, Penguin e l’EMD update, tra gli altri.

Ma questi aggiornamenti, cosi’ efficaci per quelle che definiamo middle e head-tail queries, non sono poi cosi’ efficaci per quel tipo di query che, soprattutto a causa del rapido utilizzo della ricerca su cellulare da parte degli utenti, sempre più gente sta iniziando ad usare ovvero le ricerche conversazionali di coda lunga o quelle che Amit Singhal definisce come “verbose queries” (queries pronunciate).

L’evoluzione del riconoscimento del linguaggio naturale da parte di Google, il perfezionamento della disambiguazione di entità e concetti attraverso la tecnologia ereditata da Metaweb e migliorata con Knowledge Graph e gli enormi miglioramenti apportati dalla personalizzazione della SERP, hanno dato a Google gli strumenti teorici e pratici non solo per risolvere il problema della coda lunga, ma anche per dare un nuovo slancio all’evoluzione di Google Search.

Questa e’ la cronistoria che spiega cio’ che Amit Singhal ha detto a proposito di Hummingbird, qui parafrasata da Danny Sullivan:

Hummingbird] Gave us an opportunity […] to take synonyms and knowledge graph and other things Google has been doing to understand meaning to rethink how we can use the power of all these things to combine meaning and predict how to match your query to the document in terms of what the query is really wanting and are the connections available in the documents. and not just random coincidence that could be the case in early search engines.

Come funziona Hummingbird?

 “… to take synonyms and knowledge graph and other things…”

Google ha lavorato con i sinonimi per lungo tempo. Se diamo un’occhiata alla cronologia che Google stesso ha condiviso con il post per il suo 15mo anniversario, vediamo che li usa dal 2002, anche se si può dire che la disambiguazione (intesa come analisi ortografica delle query) viene applicata già dal 2001.

L'evoluzione dei servizi Google

L’evoluzione dei servizi e delle funzionalità di Google

 L’anno scorso Vanessa Fox si chiedeva su Search Engine Land: La corrispondenza dei sinonimi di Google e’ aumentata?…“.

Leggendo quel post e vedendo gli esempi presentati risulta chiaro che i sinonimi fossero già utilizzati da Google – basandosi sullo user intent sottolineato dalla query usata – al fine di ampliare la query e riscriverla, per offrire i migliori risultati agli utenti.

Tuttavia quello stesso post ci mostra perchè solo l’uso di un thesaurus di sinonimi o la conoscenza delle query posizionate più in alto non bastano a garantire delle SERP pertinenti (Vanessa fa notare come Google non consideri “cani” come animali domestici nella ricerca “adozione di animali domestici,” ma invece consideri “gatti”).

Amit Singhal, in questo vecchio brevetto  era consapevole del fatto che basarsi solo sui sinonimi non era la soluzione perfetta perchè due parole possono essere sinonimi o meno in base al contesto in cui sono usate (es: “coche” e “automovil” significano entrambe “auto” in spagnolo, ma “carro” significa “auto” solo nello spagnolo usato in America Latina, mentre significa “carro” in Spagna).

Pertanto, al fine di offrire i migliori risultati possibili utilizzando la ricerca semantica, Google aveva bisogno di capire meglio, più semplicemente e velocemente il contesto. Hummingbird e’ il modo con il quale Google ha risposto a questo bisogno.

Come "funziona" Google

Le procedure di Google

Che i sinonimi rimangono essenziali lo ha confermato Amit Singhal nel talk post-evento con Danny Sullivan. In questo post Bill Slawski ha descritto come sono utilizzati ora.

Quel brevetto si basa anche sul concetto di “entità di ricerca”.

Parlando letteralmente, le parole non sono oggetti in sé stesse, ma la rappresentazione verbale di cose, e le entità di ricerca sono il modo con cui Google oggettivizza le parole in concetti. Un oggetto può avere un rapporto con altri che varia a seconda del contesto in cui sono usati insieme. In tal senso le parole sono trattate come persone, città, libri e tutte le altre entità abitualmente rappresentate nel Knowledge Graph.

I meccanismi utilizzati da Google per identificare le entità di ricerca sono particolarmente importanti nella disambiguazione dei possibili significati di una parola e rifinisce così il recupero delle informazioni secondo un “punteggio di probabilità”.

Questa tecnica non e’ molto differente da ciò che fa il Knowledge Graph quando, per esempio, disambigua San Pietro Apostolo dalla Basilica di San Pietro o San Pietro città nel Minnesota.

Infine c’è un terzo concetto che gioca un ruolo esplicito in quello che si potrebbe definire il “Brevetto di Hummingbird”: leco-occurrences.

Integrando questi tre elementi, ora Google e’ in grado (in teoria) di:

  • Capire meglio lo scopo di una query
  • Ampliare il pool dei documenti web che potrebbero rispondere ad una query
  • Semplificare il modo in cui fornisce le informazioni, poiché se tre diverse queries hanno sostanzialmente lo stesso significato, Google non ha bisogno di proporre tre differenti SERP ma una sola
  • Offrire una migliore esperienza di ricerca poiché espandendo le query e capendo meglio la relazione tra le entità di ricerca (basata anche sulla personalizzazione diretta/indiretta degli elementi) Google ora può offrire risultati che hanno una più alta probabilità di soddisfare le esigenze dell’utente.
  • Di conseguenza Google può offrire SERP migliori anche in termini di ads dato che, nel 99% dei casi, le “query pronunciate” non contengono annunci nelle loro SERP prima di Hummingbird.

Forse Hummingbird avrebbe potuto risolvere i problemi di lingua di Fred Astaire e Ginger Rogers …

http://www.youtube.com/watch?v=zZ3fjQa5Hls

 Il 90% delle queries sono davvero influenzate?

Molti SEO hanno messo in dubbio il fatto che Humminbgird abbia influenzato il 90% delle query, per il semplice motivo che non hanno notato nessun cambiamento in traffico e posizionamenti.

A parte il fatto che le SERP erano in costante tumulto nel periodo tra la fine di agosto e la prima meta’ di settembre (periodo in cui Hummingbird vide la luce), la tipica query del target di Hummingbird e’ quella conversazionale (es: “Qual e’ la miglior pizzeria dove mangiare vicino a Piazza del Popolo e Via del Corso?”), una query solitamente non monitorata da noi SEO.

Inoltre, Hummingbird è rivolto alle query non alle parole chiave (ancora meno alle long tail).  Per questo motivo, monitorare i posizionamenti in long tail come metrica d’ impatto di Hummingbird e’ completamente errato.

In conclusione, Hummingbird non significa l’estinzione di tutti i classici fattori di posizionamento, ma costituisce invece una nuova struttura basata su di loro. Se un sito era sia autorevole che rilevante per una query, continuerà ad avere lo stesso posizionamento di prima dell’avvento di Hummingbird.

Quindi quali siti sono stati colpiti? Probabilmente quelli che contavano unicamente sulle pagine ottimizzate per la coda lunga ma che avevano una bassa o nulla autorevolezza.

Quindi, come ha detto Rand nel suo ultimo Whiteboard Friday, ora e’ molto più conveniente creare dei contenuti linkabili/condivisibili semanticamente correlati con le queries di long tail, piuttosto che creare migliaia di pagine basate sulla long tail ma senza qualità o utilità.

Se Hummingbird è uno spostamento verso la SEO semantica, questo significa che usando Schema.org il mio sito si posizionerà meglio?

Uno dei miti che si diffusero rapidamente quando venne annunciato Hummingbird fu che l’aggiornamento era stato fatto usando dati strutturati.

Anche se e’ vero che per alcuni mesi Google ha sottolineato l’importanza dei dati strutturati (dedicandovi ad esempio una sezione all’interno di Google Wembaster Tools), considerare Schema.org come la soluzione magica non e’ corretto. E’ un esempio di come noi SEO talvolta confondiamo i mezzi con lo scopo.

Ciò che dobbiamo fare e’ fornire a Google un contesto facilmente comprensibile per i temi intorno  ai quali abbiamo creato una pagina, e i dati strutturati sono utili a questo proposito. Tuttavia, da soli, non sono abbastanza. Come detto prima, se una pagina non e’ considerata autorevole (grazie a link esterni e citazioni), sarà più facile che non abbia abbastanza forza per un buon posizionamento, soprattutto ora che le queries di coda lunga sono semplificate da Hummingbird.

Hummingbird e’ collegato alla maggiore presenza di Knowledge Graph
e Answers Cards?

In tanti si son fatti l’idea che Hummingbird sia la traduzione dal Knowledge Graph al classico Google Search e che abbia un nesso diretto col proliferare delle Answer Cards. Questa teoria ha portato ad alcuni post piuttosto arrabbiati sulla natura “scraper” di Google.

Ciò è avvalorato dal fatto che Hummingbird sia stato annunciato insieme alle nuove caratteristiche del Knowledge Graph, ma non c’è un’evidente relazione fra Hummingbird e il Knowledge Graph. Molti hanno pensato che più che una causa (Hummingbird causa più Answer Cards, etc. etc.) si tratti probabilmente di una semplice correlazione.

Hummingbird sostanzialmente semplifica le query parlate con altre più semplici che sono spesso completate dal Knowledge Graph. Per questo motivo possiamo vedere sulle SERP sempre più elementi di Knowledge Graph e Answer Cards. Detto questo, la filosofia dietro Hummingbird e Knowledge Graph e’ la stessa: passare dalle stringhe alle cose.

Hummingbird e’ fortemente basato
su Knowledge Base?

Knowledge Base e’ potente e penetrante nel funzionamento di Google, ma ridurre Hummingbird solo a Knowledge Base sarebbe semplicistico.

Come abbiamo visto Hummingbird poggia su molti elementi, e Knowledge Base e’ uno di questi, soprattutto nelle queries con personalizzazione (che possono essere considerate un livello pervasivo che influenza l’algoritmo).

Se Hummingbird  fosse pesantemente collegato a Knowledge Base, senza complementarsi con altri fattori, potremmo farci prendere dai dubbi contro cui combatteva Amit Singhal nel precedente brevetto sui sinonimi.

Hummingbird significa la fine del Link Graph?

No. Il Page Rank e gli elementi collegati ai links dell’algoritmo sono tuttora vivi e vegeti. Oserei persino dire che i link sono ora ancora più importanti.

Infatti, senza l’autorevolezza che un buon link profile garantisce ad un sito, oggi una pagina web avrebbe ancora più difficoltà a posizionarsi (si veda cosa ho scritto sopra a proposito del destino delle pagine con una bassa autorevolezza).

Ciò che ora e’ ancora più importante e’ il contesto in cui il link e’ presente. Lo avevamo già imparato con Penguin, ma Hummingbird riafferma come link provenienti da contesti di tematiche irrilevanti siano dei cattivi link.

Detto ciò, Google deve ancora migliorare sul fronte dei link, come giustamente detto da Danny Sullivan nel suo tweet:

 Links are the fossil fuel of search relevancy signals. Polluted. Not getting better. And yet, that’s what Google Hummingbird drinks most.

Danny Sullivan (@dannysullivan) October 18, 2013

Hummingbird è correlato al 100%
(not provided)?

Il fatto che Hummingbird e il 100% (not provided) siano stati lanciati quasi contemporaneamente, sembra essere più che una semplice coincidenza.

Se Hummingbird significa più search entities, miglior information retrieval ed espansione della query – un aggiornamento con il quale le keywords perdono gran parte del loro valore – allora affidarsi ai dati delle sole keywords non basta più.

Dovremmo smetterla di focalizzarci unicamente sull’ottimizzazione delle parole chiave ed iniziare a pensare all’ottimizzazione degli argomenti. Questo ci obbligherebbe a pensare a grandi contenuti e non soltanto a “contenuti”. Cose come “SEO Copywriting” finiranno per essere il sinonimo di “amazing copywriting”.

Perciò, in quanto SEO, dovremmo iniziare a capire come funzionano i canali di ricerca, e non diventare semplicemente dei dizionari umani di sinonimi.

Se Hummingbird costituisce un passo da gigante verso la SEO semantica, allora come SEO il nostro lavoro “non e’ soltanto ottimizzare per stringhe, o per oggetti, ma per i collegamenti tra le cose” come ha detto brillantemente Aaron Bradley in questo post.

[slideshare id=26399116&doc=semantic-seo-shift-from-strings-to-things-aaron-bradley-130920205725-phpapp02]

Cosa dobbiamo fare per essere
Hummingbird-friendly?

Lasciate che vi ponga qualche domanda, e cercate di rispondere sinceramente.

1) Quando siete in procinto di creare/ottimizzare un sito, lo fate tenendo in mente un’audience specifica?

2) Quando eseguite l’ottimizzazione della pagina del vostro sito, seguite queste SEO best practices?

  • Utilizzare un’architettura di informazioni chiara e non eccessivamente complessa
  • Evitare problemi di canonicalizzazione
  • Evitare problemi di scarsi contenuti
  • Creare un modello di contenuto semantico
  • Ottimizzare per argomento il contenuto del sito pagina su pagina, usando un linguaggio naturale e semanticamente ricco, avendo in mente una strategia  landing page-centrica
  • Creare dei contenuti utili servendosi di più formati che tu stesso saresti portato a condividere con i tuoi amici e linkare
  • Implementare Schema.org, Open Graph e altri markup semantici

3) I tuoi obiettivi di link-building sono:

  • Migliore visibilità del marchio?
  • Guadagnare traffico dai referral?
  • Rafforzare il senso di leadership percepita del tuo brand?

4) Come SEO, i Social Media offrono questi vantaggi?

  • Una più ampia visibilità del marchio
  • Eco sociale
  • Aumento delle citazioni/link sotto forma di derivati, co-occurrences e co-citation in altri siti web
  • Traffico organico e crescita dei brand ambassadors

 

Se hai risposto sì a tutte queste domande, non devi fare altro che proseguire col buon lavoro, raffinarlo ed essere creativo e coinvolgente. Probabilmente vedi già il tuo sito con un buon posizionamento grazie alla visione più olistica che hai del SEO.

Se invece hai risposto no ad alcune di loro, allora devi solo correggere le cose che stai sbagliando e seguire le cosiddette SEO Best practices.

Se hai risposto no a molte domande, allora avevi problemi ben prima del rilascio di Hummingbird e le cose non miglioreranno certo se non cambi radicalmente la tua mentalità.

Hummingbird non ci sta chiedendo di riconsiderare il SEO o di reinventare la ruota. Ci sta semplicemente chiedendo di non fare del SEO schifoso … ma questo dovremmo già’ saperlo, no?

Titolo originale “Hummingbird Unleashed” scritto da Gianluca Fiorelli e pubblicato su www.moz.com il 24 Ottobre 2013.