AVVISO IMPORTANTE: Dato l'elevato numero di richieste, Eternal Curiosity non può accettare nuovi clienti, sia che si tratti di consulenze scritte che di ottimizzazione SEO diretta. Valutiamo solo casi eccezionali e ad alto budget. Per informazioni, vi invitiamo a scriverci a [email protected]

Questo articolo apparteneva al vecchio blog (blog.danilopetrozzi.it), per cui le informazioni potrebbero non essere più aggiornate ed attendibili.

Google: best practices per le sitemap XML e feed RSS/Atom

Il blog di Google per Webmaster viene aggiornato di rado, ma ogni nuovo post deve essere letto con cura, sopratutto da chi si occupa di SEO.

In un recente post, Alkis Evlogimenos ha voluto fare chiarezza su un argomento molto specifico: come e quando si usa la sitemap XML e il feed RSS/Atom.

Differenza tra sitemap e feed

La sitemap viene utilizzata per comunicare ai motori di ricerca tutti gli URL presenti in un determinato sito con il fine di garantire la migliore profondità di scansione possibile. A differenza delle sitemap, i feed hanno come scopo primario quello di rappresentare le ultime modifiche apportate al sito.

Da queste semplici definizioni è possibile capire che le sitemap e i feed si usano per scopi differenti ma sono entrambi importanti per favorire il posizionamento SEO, grazie a una migliore e più rapida “scansionabilità” di tutte le pagine, vecchie o nuove che siano.

Per migliorare il “crawling”, Google consiglia di usare sia le sitemap che i feed. Grazie ai feed, riuscirà a mantenere l’indice “più fresh” grazie ai contenuti aggiornati di recente.

La sintassi

La sintassi dei 3 formati di cui abbiamo parlato ora è abbastanza facile. Di seguito lo stesso esempio in formato XML, RSS e Atom:

XML

RSS

Atom

Best practices per l’uso di sitemap e feed

I formati di cui abbiamo parlato possono essere ampliati profondamente grazie a informazioni aggiuntive (metadata) relative agli URL (sopratutto nel caso dei feed).

A parte queste informazioni “extra”, le due parti più importanti per Google sono l’URL e il last modification time.

URL

Quando si inserisce un URL in una sitemap o in un feed, bisogna sempre accertarsi che questo sia leggibile agli occhi di Googlebot. Lo strumento “visualizza come Google” permette di far scansionare una pagina tramite Googlebot, per leggerne il risultato.

L’errore più comune è quello di inserire pagine inesistenti oppure URL bloccati da alcune regole del robots.txt.

Nel caso in cui più URL facciano riferimento allo stesso contenuto, è bene inserire solo il rel=”canonical”, in modo da evitare la sottomissione di pagine duplicate.

Last modification time

Il last modification time è l’ultima data in cui uno specifico URL è stato modificato. Comunicare questo dato tramite XML o feed è importante non solo per informare Googlebot, ma anche perché spesso questo dato viene utilizzato in SERP come rich snippet o per altri scopi simili.

Il last modification time deve essere inserito solo quando il contenuto viene effettivamente modificato, e non quando la sitemap/feed viene servita. Ognuno dei tre formati adotta sintassi e codifica della data differenti:

Consigli per le sitemap

Data la sua natura, una sitemap dovrebe includere tutti gli URL di un sito e non dovrebbe essere aggiornata frequentemente (in base alla tipologia del sito).

Se il tuo sito è composto da una sola sitemap XML, aggiornala una volta al giorno, inviala a Google e pingala.

Se invece hai diverse sitemap, ottimizzale in questo modo: inserisci fino a 50.000 URL in ogni sitemap, stando attendo a non superare i 10MB ciascuna (limite massimo permesso da Google). Quando degli URL vengono aggiunti/modificati in una specifica sitemap, aggiorna/pinga solo quella, per evitare inutile spreco di risorse a Googlebot.

Consigli per i feed

A differenza delle sitemap, i feed sono piccoli e aggiornati molto di frequente, dato che devono rispecchiare le ultime modifiche apportate al sito.

Ogni volta che un URL viene aggiornato o modificato, è bene variare il last modification time di conseguenza, che nei feed ricopre un ruolo doppiamente più importante rispetto alle sitemap.

Per fare in modo che Googlebot non si perda nulla, è bene che il feed sia “lungo abbastanza” per racchiudere tutte le modifiche che sono avvenute tra un passaggio di Googlebot e il successivo. Nel caso di siti che modificano parecchi contenuti al giorno, Google consiglia di usare dei propagatori di feed che si occupano proprio di questo, come PubSubHubbub.

 

Per qualsiasi dubbio riguardo le sitemap, vi ricordo che c’è il forum di Google dedicato alle sitemap (e qui la versione italiana)

 

Danilo petrozzi

Ciao! Io sono Danilo Petrozzi, il fondatore di Eternal Curiosity. Oltre a essere un senior SEO Specialist e un Web Developer, è dall'età di 9 anni che mi appassiono a qualsiasi cosa ruoti intorno al web e all'informatica in generale.

Lascia un commento