Glossario

Glossario: Sitemap XML

Immaginiamo il nostro sito web come una casa con tante stanze, mentre il Crawler di Google è una sorta di “controllore” che viene a visitarla per vedere se tutto è a posto e degno di essere indicizzato.

Da bravi padroni di casa, sicuramente vorremo fargli trovare tutto ordinato e pulito, e lo guideremo fra i vari ambienti. “Questa è la cucina, questa è la camera da letto, questo invece è il bagno…”, eccetera.
Insomma se tutto è tirato a lucido e piace al Crawler, Google darà la sua approvazione e indicizzerà la nostra casa (beh, le nostre pagine web) nei risultati di ricerca. Più è in grado di raggiungere tutte le stanze e analizzarle correttamente, allora più alto sarà il numero di risorse che deciderà di mostrare agli utenti.

Una Sitemap, come dice il nome stesso, è la mappa di un sito web. Si tratta in pratica di un file contenente una lista ordinata delle URL che vogliamo indicizzare sui motori di ricerca.

Pensalo come un “aiuto”, una guida, o appunto una mappa che possiamo consegnare in mano al crawler per guidarlo nella scoperta di contenuti e pagine. Ovviamente questo è un passaggio fondamentale per la SEO di un sito, e pertanto va fatto a modino 🙂

Ora che abbiamo capito cosa è una Sitemap, guardiamola da un punto di vista tecnico.

Possono essere in due formati: HTML e XML.

Le Sitemap in formato HTML sono più delle risorse destinate agli utenti e a facilitare la navigazione.

Le Sitemap XML, invece, sono più interessanti a livello SEO, perchè sono loro a dialogare col motore di ricerca. Vediamo queste in particolare. Una Sitemap XML si presenta così:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.esempio.it/</loc>
<lastmod>2017-09-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.esempio.it/contatti/</loc>
<lastmod>2017-07-21</lastmod>
<changefreq>monthly</changefreq>
<priority>0.3</priority>
</url>
</urlset> 

 

Come vediamo, all’interno del tag <url> si trovano queste informazioni:

  • <loc> è l’indirizzo URL della pagina.
  • <lastmod> contiene data e ora dell’ultima modifica. Può indicare allo Spider che la pagina è stata recentemente riaggiornata e quindi deve essere nuovamente scansionata.
  • <changefreq> dà la frequenza approssimativa di aggiornamento. Può essere always, hourly, daily, weekly, monthly, yearly o never.
  • <priority> indica un valore da 0.0 a 1.0 che possiamo assegnare noi alla pagina per identificare la priorità che vogliamo dargli rispetto alle altre.

In realtà solo il primo tag <loc> è obbligatorio, gli altri sono facoltativi ma caldamente raccomandabili.

Solitamente i CMS come WordPress hanno delle funzionalità interne che creano la Sitemap automaticamente, ma esistono anche dei generatori di Sitemap online che “masticano” il sito e “sputano fuori” il file, che potrai poi caricare nella directory tramite accesso FTP.

Il passo successivo consiste nel comunicare al motore di ricerca qual è la mappa del tuo sito: per Google si utilizza la Search Console andando su Scansione > Sitemap.

Vuoi essere un bravo padrone di casa quando Google ti verrà a trovare, vero? Non fargli trovare calzini sporchi in giro e prepara al meglio la Sitemap del tuo sito 😀

Matteo Zambon

Recent Posts

Caso studio: FGM04 registra +72% di attribuzione delle conversioni e 98% di accuratezza dei dati tracciati grazie una strategia di Data Governance personalizzata

Fgm04, fondata nel 2004 è una realtà di cosmeceutica professionale, evolutasi fino a diventare un…

4 giorni ago

Cosa sono, come funzionano e come configurare gli Smart Events in Microsoft Clarity

Gli Smart Events di Microsoft Clarity sono eventi che tracciano automaticamente le azioni più importanti…

4 settimane ago

Universal Commerce Protocol e Business Agent: cosa cambia e le implicazioni per la Digital Analytics di retailer ed ecommerce

L'11 gennaio 2025 Google ha annunciato il lancio di Universal Commerce Protocol (UCP), un nuovo…

4 settimane ago

Caso studio Champion Europe: +35% ROAS e +31% di acquisti tracciati grazie Server-Side, Consent Mode V2 e GA4

Champion, storico brand americano fondato nel 1919 e tra i protagonisti del mondo sportswear e…

2 mesi ago

6 brand ed ecommerce eccellenti che hanno ottenuto un impatto di business tangibile grazie ai dati

In un contesto dove AI, privacy e percorsi di navigazione omnichannel stanno cambiando il modo…

5 mesi ago

Model Context Protocol (MCP) Server di Stape: cos’è, come funziona, come configurarlo

Se ti occupi di digital analytics, tag management o lavori con Google Tag Manager Server-Side,…

9 mesi ago