Una sitemap, o site map, o semplicemente mappa, è un file tipicamente XML in cui vengono fornite ai crawler informazioni sulle pagine, sui contenuti multimediali o video e su altri file presenti nel sito.
I motori di ricerca, come Google, analizzano questo file per eseguire una scansione più efficiente dato che la sitemap elenca caratteristiche come la data di aggiornamento (lastmod
), la frequenza di modifica (changefreq
), la priorità di scansione (priority
) o la presenza di immagini o contenuti video all’interno della pagina.
Quello che segue è un semplice esempio di sitemap:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com</loc>
<lastmod>2019-03-12</lastmod>
<changefreq>weekly</changefreq>
<priority>1</priority>
</url>
<url>
<loc>https://example.com/about/</loc>
<lastmod>2019-02-28</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>https://example.com/news/</loc>
<lastmod>2019-08-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
</urlset>
Anche se viene utilizzata comunemente solo per costruire un indice delle pagine esistono diversi tipi di sitemap destinati ad esempio ai video, alle immagini o alle notizie (Google News).
Un sito può avere molteplici sitemap divise ad esempio per tipologia di contenuto (pagine, post, archivio) o per lingua nel caso siano presenti più versioni delle pagine tradotte.
È molto importante segnalare la presenza di ogni mappa all’interno del robots.txt per aiutare i motori di ricerca ad effettuare una scansione più accurata del sito.