Il blog è archiviato e questo articolo è vecchio di diversi anni. Le informazioni al suo interno potrebbero essere inesatte o non più aggiornate. Torna alla home

Varie statistiche su Google che ogni SEO dovrebbe conoscere
27 Agosto 2014Una volta che ti addentri nelle statistiche.. non puoi farne a meno 😀
Dopo aver parlato di browser, analisi SEO on-page e futuro della SEO, oggi parliamo di Google, il nostro motore di ricerca preferito. Quelle che sto per proporvi sono alcune informazioni, più o meno facilmente reperibili online, legate a Google.
Con ben 46170 dipendenti (dato 2014 ufficiale) e con un ricavo superiore ai 28 miliardi di dollari proveniente dall’advertising solo nei primi 6 mesi del 2014, Google è una delle aziende tech più prospere e solide del mondo.
Bando alle ciance, oggi voglio essere rapido e concreto:
Numero di ricerche effettuate ogni secondo su Google
Che dire, numeri da capogiro!
Google passa da un numero di ricerche medie al secondo di 13880 nel 2008 a ben 68496 nel 2013.
In soli 6 anni Google ha quasi moltiplicato per 5 il numero di ricerche effettuate sul suo motore di ricerca.
Dimensione (peso) dell’index di Google in byte
I dati riguardo il peso effettivo dell’indice sono riservati, e molto approssimativi, ma è possibile fare qualche confronto interessante. Il dato più preciso riguardo le dimensioni dell’indice di Google risale al 2012 e fa riferimento a oltre 100.000.000 di gigabyte! (dato ufficiale by Google)
Se l’indice di Google fosse inserito in dei tradizionali CD -ROM da 700MB, sarebbero così tanti che un CD potrebbe essere distribuito a ogni italiano, ogni francese, ogni svedese e ogni greco del pianeta.. e ne avanzerebbe ancora qualcuno 😀
Anche se l’indice possa sembrare enorme (oggi sicuramente è molto più grande di 100 milioni di GB), è comunque una frazione dell’intero World Wide Web. Quant’è grande l’intero internet? Beh, difficile dirlo. Il peso di internet non può essere misurato, ma solo stimato.
Lo stesso Eric Schmidt di Google ha fatto una celebre stima della grandezza totale del WWW: secondo lui è composto da circa 5.000.000 di terabyte ossia 5 miliardi di gigabyte.
Ti ho confuso con tutti questi byte? Guarda questo grafico che mostra a colpo d’occhio il rapporto tra l’indice di Google (del 2012) e la stima della grandezza di internet fatta da Schmidt:
Ehehe, e tu che pensavi che l’indice era grande 😀
URL unici presenti nell’indice
Purtroppo le stime riguardo gli URL singoli, sia dell’indice di Google sia dell’intero WWW, sono irreperibili. Le uniche stime ufficiose di Google, ci dicono che:
- nel 2009 Google aveva superato il triliardo di URL unici scansionati
- nel 2012 gli URL unici nell’index sono superiori ai 30 triliardi (30.000.000.000.000)
Pagine scansionate da Googlebot
Se analizziamo la quantità di pagine scansionate giornalmente da Googlebot, l’asticella si “ferma” a ben 20 miliardi. (il dato è ufficiale by Google)
Questo significa che Googlebot va a aprire più di 230.000 pagine al secondo.
Velocità di esecuzione delle query
Un altro dato ufficiale by Google: il tempo medio che il motore di ricerca impiega per elaborare la search, reperire i risultati e mostrarli all’utente è di 125 millisecondi.
Nuove ricerche ogni giorno
Ogni giorno, il 16% – 20% delle ricerche sono inedite, ossia non sono mai state eseguite prima all’interno di Google.
Miglioramento dell’algoritmo
Valutazioni di precisione
Ogni anni i quality rater eseguono mediamente 40.000 valutazioni manuali che mirano a stabilire la qualità dei risultati di ricerca. Particolare attenzione viene attribuita al tipo delle query e ai loro risultati.
Valutazioni side-by-side
Le valutazioni side-by-side prevedono il confronto tra i risultati di ricerca per una determinata keyword prima e dopo l’implementazione di un nuovo algoritmo.
Quando gli sviluppatori di Google hanno deciso di modificare un fattore di rankin o di alterare altri parametri della search, vengono condotti dei test A/B (side-by-side) in cui vengono confrontate le SERP pre-aggiornamento e quelle post-aggiornamento, per assicurarsi che ci sia stato un miglioramento nella qualità dei risultati di ricerca.
Ogni anno vengono eseguiti mediamente 9.000 valutazioni side-by-side.
Valutazioni in real time
Un altro meccanismo usato da Google per testare gli aggiornamenti dell’algoritmo sono le valutazioni in real time.
Ecco come funzionano: Google altera volontariamente i risultati di ricerca di una determinata keyword per un numero limitato di utenti. (gli utenti in esame non si accorgono di nulla e non sanno di essere “vittime” del test).
Google, quindi, analizza il feedback prodotto dagli utenti esaminati rispetto agli utenti globali e verifica se ci siano variazioni significative nel CTR, bounce rate, pageviews e così via.
Ogni anno, vengono condotti circa 7.000 valutazioni in real time.
Quantità di aggiornamenti all’algoritmo di Google
Il numero di aggiornamenti che vengono implementati nell’algoritmo di Google ogni anno è un dato molto controverso. (I dati ufficiali e ufficiosi sono numerosi)
Nelle pagine del supporto ufficiale viene citato il numero di 500 modifiche all’anno, ma fonti ufficiose spesso hanno anche parlato di 800+ modifiche annuali.
Ok, ok. Già vi sento!
Finora ho parlato di dati un pò “generici”, non legati strettamene alla SEO. Ma io lo so che voi siete esigenti e che non vi accontentate di quattro numeretti. E allora svisceriamo 3 grafici molto interessanti! Sono stati prodotti circa 1 anno fa, ma sono comunque interessanti.
Attenzione: a differenza dei due grafici in alto, che ho prodotto io, i prossimi tre sono ufficiali in quanto prodotti da Google.
Comunicazioni da Google ai Webmaster
Nel grafico potete osservare la quantità di messaggi mensili che sono stati inviati da Google ai webmaster attraverso il Webmaster Tools dal 2007.
Sì, lo so che mancano i valori sull’asse delle ascisse e una legenda, ma se Google non è professionale quanto me nel fare i grafici, prendetevela con lei, non con me 😀
Comunicazioni dai Webmaster a Google (richieste di riconsiderazione)
Questo invece è il grafico che indica tutte le richieste di riconsiderazione settimanali inoltrate a Google a partire dal 2006.
Come si può ben vedere, le richieste sono aumentate negli ultimi anni grazie al maggiore impegno di Google nella lotta allo spam.
Azioni manuali mensili
Chiudiamo in bellezza. Beccatevi questo grafico by Google (in italiano :D) che mostra tutte le azioni manuali perpretate mensilmente da Google nei confronti di diverse tipologie di spam.
La prima cosa che salta all’occhio è il fatto che in alcuni mesi ci sono state più di 500.000 azioni manuali, HOLY SH.. 😀
E io che pensavo che l’azione manuale fosse una eccezione!
Spulciamo quest’ultimo grafico
Possiamo notare che lo spam puro è l’elemento su cui Google si è più accanito. Le altre forme di spam, sopratutto nei tempi recenti, sono tutte più o meno allo stesso livello.
Analizzando con accuratezza la legenda e il grafico, possiamo fare queste ulteriori riflessioni:
- dopo lo spam puro, i tre elementi maggiormente colpiti da azione manuale sono il “sito compromesso”, “i contenuti poco rilevanti” e i link non naturali provenienti o ricevuti dal sito. (arancione, verde e rosa)
- nella legenda è presente “Dominio parcheggiato“, quindi evidentemente i domini parcheggiati possono, in determinate condizioni, essere vittima di azione manuale e non solo della ben nota “azione” algoritmica (per me questa è una notizia!)
- oltre agli host gratuiti, anche i provider di DNS dinamici che contengono spam possono essere vittima di azione manuale. Del primo ero a conoscenza (ci sono state in passato anche delle maxi penalizzazioni a host free) ma non avevo mai sentito parlare di azione manuale contro un intero provider DNS. (altra notizia?)
- capisco l’azione manuale per “contenuti generati automaticamente”, ma che diavolo sarebbe “Spazi illimitati“? Qualcuno lo sa? Nella versione inglese è “infinite spaces”, quindi di scarso aiuto (presunta notizia?)
Conclusione
Spero che questi dati vi siano stati utili. L’ultimo grafico permette di fare ulteriori approfondimenti che possono essere molto interessanti. Io stesso mi so attivando per fare qualche prova, ma se avete qualche dato o esperienza legata all’argomento, fatecela sapere!