Sitemaps XML : Guide des bonnes pratiques

Le protocole Sitemap XML a été créé par Google en 2005 avant d’être adopté par d’autres moteurs de rechercher comme Baidu, Bing, Yahoo…

Suite à l’article de Philippe Yonnet, Sitemaps XML : certains attributs seront bientôt obsolètes, il nous a semblé intéressant de faire le point sur les sitemaps.

Un sitemap est un fichier dans lequel vous donnez des informations sur les pages, les vidéos et les autres fichiers présents sur votre site, et dans lequel vous indiquez les relations entre ces fichiers. Les moteurs de recherche tels que Google lisent ce fichier pour explorer plus efficacement votre site. Un sitemap indique à Google les fichiers que vous jugez importants sur votre site et fournit également des informations précieuses sur ces fichiers. Par exemple, il permet d’indiquer la dernière date de mise à jour d’une page, sa fréquence de modification et les versions qui existent dans d’autres langues.

Google Search Central Documentation

Les bonnes pratiques pour les sitemaps

Un sitemap doit être composé :

  • Uniquement d’URL canoniques (en self-referencing)
  • D’aucune URL redirigée (aucune URL en 3XX), aucune URL en 4XX et aucune URL en 5XX
  • Toutes les URL indexables (code HTTP 200)

Il est important d’exclure des sitemaps toutes les autres URL.

De plus, les sitemaps doivent être tenus à jour et modifiés en temps réel quand une URL ne répond plus aux critères ci-dessus. Pour la majorité des CMS, il existe aujourd’hui des plugins qui vous aident à automatiser la gestion du sitemap. Sur WordPress par exemple, Yoast peut générer un sitemap de votre site avec une mise à jour automatique, mais attention à surveiller la pertinence de ce dernier grâce à votre Google Search Console. Sinon, il reste possible de créer un script pour automatiser cette tâche.

Pour plus d’informations, n’hésitez pas à consulter ce lien : https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?hl=fr

Suis-je obligé d’utiliser un sitemap pour mon site ?

C’est peut-être surprenant, mais non, un sitemap n’est pas toujours indispensable pour votre site internet.

Google évoque 3 cas :

  • Si votre site ne contient pas plus d’environ 500 pages que vous souhaitez voir indexées, alors l’utilisation d’un sitemap n’est pas indispensable.
  • Un maillage de qualité, autrement dit si votre site propose des liens pour l’ensemble de ses pages, vous dispense d’avoir recours à un sitemap.
  • Si vous ne souhaitez pas faire indexer vos images, vidéos ou actualités, alors vous n’avez pas besoin d’avoir recours à un sitemap.

Dans quels cas dois-je utiliser un sitemap sur mon site ?

Google conseille le sitemap dans 4 situations :

  • En cohérence avec ce qui a été dit précédemment, si à l’inverse votre site est très volumineux avec de nouvelles pages créées régulièrement, alors l’utilisation d’un sitemap automatisé est conseillé.
  • Si votre maillage n’est pas optimisé et que certaines pages de votre site se retrouvent orphelines, vous pouvez les lister dans un sitemap pour vous assurer que Google puisse les trouver.
  • Les liens externes menant vers votre site aident Googlebot à découvrir et à explorer vos pages, si votre site est récent, il y a un risque que les robots mettent un certain temps avant de découvrir toutes vos pages, il vaut donc mieux ajouter un sitemap.
  • Si vous souhaitez faire indexer des vidéos, des images ou apparaître sur Google Actualités, alors il est conseillé d’avoir recours à l’utilisation d’un sitemap.

Nos recommandations pour une bonne utilisation du sitemap

Il est recommandé de publier un sitemap à la racine du site.

Les URL écrites dans les sitemaps doivent être complètes et entières (les chemins absolus).

N’incluez pas d’identificateur de session (aussi appelé identifiant de session) dans les URL de votre sitemap pour éviter une double exploration de ces URL.

Encodez vos fichiers sitemaps en UTF-8.

Envoyez à Google un unique fichier sitemap qui peut être un index de plusieurs sitemaps. Pour rappel, un sitemap ne peut contenir que jusqu’à 50 000 URL et ne doit pas dépasser 50Mo.

Si vous avez des URL différentes pour la version classique et la version mobile d’une page, Google recommande de renvoyer vers une seule version. Toutefois, si vous avez besoin de renvoyer vers les deux URL, annotez-les pour indiquer la version classique et la version mobile.

Utilisez les extensions de sitemaps pour renvoyer vers d’autres types de supports, tels que des vidéos, des images et des actualités.

À savoir, les sitemaps compressés (ou zippés) ne font ni gagner du temps à Googlebot ni diminuer le budget crawl .

N’oubliez pas que les sitemaps vous permettent de recommander à Google les pages que vous jugez essentielles. Google ne s’engage pas à explorer toutes les URL d’un sitemap.

Google ignore les valeurs <priority> et <changefreq>. Pour plus d’informations, consultez l’article Pourquoi Google ignore-t’il l’attribut priority et changefreq dans les sitemaps XML ?.

Google utilise la valeur <lastmod> si elle est cohérente et vérifiable (par exemple, en comparant la dernière modification de la page).

La position d’une URL dans un sitemap n’est pas importante. Google n’y explore pas les URL dans leur ordre d’apparition.

Faire connaitre un fichier sitemap à Google

Le plus simple est de le déclarer via le fichier robots.txt. Par exemple :

Sitemap: https://example.com/my_sitemap.xml

Contrôler un fichier sitemap avec Google

Pour vérifier la validité de votre sitemap vous pouvez directement l’ajouter sur la Google Search Console dans l’onglet Sitemaps.

Si vous avez besoin d’aide pour savoir comment envoyer des sitemaps via la Search Console, n’hésitez pas à aller lire cette documentation : https://developers.google.com/search/docs/advanced/sitemaps/large-sitemaps?hl=fr

Laisser un commentaire