Questo articolo apparteneva al vecchio blog (blog.danilopetrozzi.it), per cui le informazioni potrebbero non essere più aggiornate ed attendibili.

Varie statistiche su Google che ogni SEO dovrebbe conoscere

statistiche

Una volta che ti addentri nelle statistiche.. non puoi farne a meno 😀

Dopo aver parlato di browser, analisi SEO on-page e futuro della SEO, oggi parliamo di Google, il nostro motore di ricerca preferito. Quelle che sto per proporvi sono alcune informazioni, più o meno facilmente reperibili online, legate a Google.

Con ben 46170 dipendenti (dato 2014 ufficiale) e con un ricavo superiore ai 28 miliardi di dollari proveniente dall’advertising solo nei primi 6 mesi del 2014, Google è una delle aziende tech più prospere e solide del mondo.

Bando alle ciance, oggi voglio essere rapido e concreto:

Numero di ricerche effettuate ogni secondo su Google

ricerche giornaliere su google

Che dire, numeri da capogiro!

Google passa da un numero di ricerche medie al secondo di 13880 nel 2008 a ben 68496 nel 2013.

In soli 6 anni Google ha quasi moltiplicato per 5 il numero di ricerche effettuate sul suo motore di ricerca.

Dimensione (peso) dell’index di Google in byte

I dati riguardo il peso effettivo dell’indice sono riservati, e molto approssimativi, ma è possibile fare qualche confronto interessante. Il dato più preciso riguardo le dimensioni dell’indice di Google risale al 2012 e fa riferimento a oltre 100.000.000 di gigabyte! (dato ufficiale by Google)

Se l’indice di Google fosse inserito in dei tradizionali CD -ROM da 700MB, sarebbero così tanti che un CD potrebbe essere distribuito a ogni italiano, ogni francese, ogni svedese e ogni greco del pianeta.. e ne avanzerebbe ancora qualcuno 😀

Anche se l’indice possa sembrare enorme (oggi sicuramente è molto più grande di 100 milioni di GB), è comunque una frazione dell’intero World Wide Web. Quant’è grande l’intero internet? Beh, difficile dirlo. Il peso di internet non può essere misurato, ma solo stimato.

Lo stesso Eric Schmidt di Google ha fatto una celebre stima della grandezza totale del WWW: secondo lui è composto da circa 5.000.000 di terabyte ossia 5 miliardi di gigabyte.

Ti ho confuso con tutti questi byte? Guarda questo grafico che mostra a colpo d’occhio il rapporto tra l’indice di Google (del 2012) e la stima della grandezza di internet fatta da Schmidt:

rapporto tra indice di google e web intero

Ehehe, e tu che pensavi che l’indice era grande 😀

URL unici presenti nell’indice

Purtroppo le stime riguardo gli URL singoli, sia dell’indice di Google sia dell’intero WWW, sono irreperibili. Le uniche stime ufficiose di Google, ci dicono che:

  • nel 2009 Google aveva superato il triliardo di URL unici scansionati
  • nel 2012 gli URL unici nell’index sono superiori ai 30 triliardi (30.000.000.000.000)

Pagine scansionate da Googlebot

Se analizziamo la quantità di pagine scansionate giornalmente da Googlebot, l’asticella si “ferma” a ben 20 miliardi. (il dato è ufficiale by Google)

Questo significa che Googlebot va a aprire più di 230.000 pagine al secondo.

Velocità di esecuzione delle query

Un altro dato ufficiale by Google: il tempo medio che il motore di ricerca impiega per elaborare la search, reperire i risultati e mostrarli all’utente è di 125 millisecondi.

Nuove ricerche ogni giorno

Ogni giorno, il 16% – 20% delle ricerche sono inedite, ossia non sono mai state eseguite prima all’interno di Google.

Miglioramento dell’algoritmo

Valutazioni di precisione

Ogni anni i quality rater eseguono mediamente 40.000 valutazioni manuali che mirano a stabilire la qualità dei risultati di ricerca. Particolare attenzione viene attribuita al tipo delle query e ai loro risultati.

Valutazioni side-by-side

Le valutazioni side-by-side prevedono il confronto tra i risultati di ricerca per una determinata keyword prima e dopo l’implementazione di un nuovo algoritmo.

Quando gli sviluppatori di Google hanno deciso di modificare un fattore di rankin o di alterare altri parametri della search, vengono condotti dei test A/B (side-by-side) in cui vengono confrontate le SERP pre-aggiornamento e quelle post-aggiornamento, per assicurarsi che ci sia stato un miglioramento nella qualità dei risultati di ricerca.

Ogni anno vengono eseguiti mediamente 9.000 valutazioni side-by-side.

Valutazioni in real time

Un altro meccanismo usato da Google per testare gli aggiornamenti dell’algoritmo sono le valutazioni in real time.

Ecco come funzionano: Google altera volontariamente i risultati di ricerca di una determinata keyword per un numero limitato di utenti. (gli utenti in esame non si accorgono di nulla e non sanno di essere “vittime” del test).

Google, quindi, analizza il feedback prodotto dagli utenti esaminati rispetto agli utenti globali e verifica se ci siano variazioni significative nel CTR, bounce rate, pageviews e così via.

Ogni anno, vengono condotti circa 7.000 valutazioni in real time.

Quantità di aggiornamenti all’algoritmo di Google

Il numero di aggiornamenti che vengono implementati nell’algoritmo di Google ogni anno è un dato molto controverso. (I dati ufficiali e ufficiosi sono numerosi)

Nelle pagine del supporto ufficiale viene citato il numero di 500 modifiche all’anno, ma fonti ufficiose spesso hanno anche parlato di 800+ modifiche annuali.

 grafici cani

Ok, ok. Già vi sento!

Finora ho parlato di dati un pò “generici”, non legati strettamene alla SEO. Ma io lo so che voi siete esigenti e che non vi accontentate di quattro numeretti. E allora svisceriamo 3 grafici molto interessanti! Sono stati prodotti circa 1 anno fa, ma sono comunque interessanti.

Attenzione: a differenza dei due grafici in alto, che ho prodotto io, i prossimi tre sono ufficiali in quanto prodotti da Google.

Comunicazioni da Google ai Webmaster

comunicazioni ai webmaster

Nel grafico potete osservare la quantità di messaggi mensili che sono stati inviati da Google ai webmaster attraverso il Webmaster Tools dal 2007.

Sì, lo so che mancano i valori sull’asse delle ascisse e una legenda, ma se Google non è professionale quanto me nel fare i grafici, prendetevela con lei, non con me 😀

Comunicazioni dai Webmaster a Google (richieste di riconsiderazione)

richieste di riconsiderazione

Questo invece è il grafico che indica tutte le richieste di riconsiderazione settimanali inoltrate a Google a partire dal 2006.

Come si può ben vedere, le richieste sono aumentate negli ultimi anni grazie al maggiore impegno di Google nella lotta allo spam.

Azioni manuali mensili

Chiudiamo in bellezza. Beccatevi questo grafico by Google (in italiano :D) che mostra tutte le azioni manuali perpretate mensilmente da Google nei confronti di diverse tipologie di spam.

azioni manuali mensiliLa prima cosa che salta all’occhio è il fatto che in alcuni mesi ci sono state più di 500.000 azioni manuali, HOLY SH.. 😀 

E io che pensavo che l’azione manuale fosse una eccezione!

Spulciamo quest’ultimo grafico

Possiamo notare che lo spam puro è l’elemento su cui Google si è più accanito. Le altre forme di spam, sopratutto nei tempi recenti, sono tutte più o meno allo stesso livello.

Analizzando con accuratezza la legenda e il grafico, possiamo fare queste ulteriori riflessioni:

  • dopo lo spam puro, i tre elementi maggiormente colpiti da azione manuale sono il “sito compromesso”, “i contenuti poco rilevanti” e i link non naturali provenienti o ricevuti dal sito. (arancione, verde e rosa)
  • nella legenda è presente “Dominio parcheggiato“, quindi evidentemente i domini parcheggiati possono, in determinate condizioni, essere vittima di azione manuale e non solo della ben nota “azione” algoritmica (per me questa è una notizia!)
  • oltre agli host gratuiti, anche i provider di DNS dinamici che contengono spam possono essere vittima di azione manuale. Del primo ero a conoscenza (ci sono state in passato anche delle maxi penalizzazioni a host free) ma non avevo mai sentito parlare di azione manuale contro un intero provider DNS. (altra notizia?)
  • capisco l’azione manuale per “contenuti generati automaticamente”, ma che diavolo sarebbe “Spazi illimitati“? Qualcuno lo sa? Nella versione inglese è “infinite spaces”, quindi di scarso aiuto (presunta notizia?)

Conclusione

Spero che questi dati vi siano stati utili. L’ultimo grafico permette di fare ulteriori approfondimenti che possono essere molto interessanti. Io stesso mi so attivando per fare qualche prova, ma se avete qualche dato o esperienza legata all’argomento, fatecela sapere!

Danilo petrozzi

Ciao! Io sono Danilo Petrozzi, il fondatore di Eternal Curiosity. Oltre a essere un senior SEO Specialist e un Web Developer, è dall'età di 9 anni che mi appassiono a qualsiasi cosa ruoti intorno al web e all'informatica in generale.

Lascia un commento