Bien gérer les lastmod sur les sitemaps : c’est devenu incontournable

Nous avions eu l’occasion de l’indiquer dans un article du blogarithme Népérien l’année dernière : l’attribut « lastmod » dans les sitemaps est devenu très important pour accélérer la découverte de vos pages.

L’attribut lastmod est censé contenir la date de dernière modification d’une url. Une information qui peut-être utile pour qu’un bot de moteur de recherche puisse prioriser correctement le crawl des urls dans le sitemap et :

  • ne pas recrawler les urls qui n’ont pas été modifiée depuis l’analyse de la version précédente du sitemap
  • et crawler en priorité les nouvelles urls.

La syntaxe de l’attribut « lastmod » dans un fichier XML sitemap

Google a longtemps superbement ignoré cet attribut, qu’il avait pourtant prévu dans le format des sitemaps XML lorsqu’ils avaient lancé leur initiative.

Du coup, les propriétaires de sites les plus futés avaient pris l’habitude de « pinger » Google à l’aide d’une url spéciale pour l’inciter à repasser sur les fichiers sitemap XML dès qu’ils étaient modifiés.

Mais voilà : Google a décidé de désactiver cette fonctionnalité, qui était hélas trop souvent utilisée à mauvais escient.

Sauf que sans cette « béquille », comment Google peut se rendre compte qu’il y’a des urls à recrawler dans un sitemap ?

Et bien, la solution qu’à trouvé Google, c’est de se baser sur l’attribut « lastmod »

Si vous faites partie des gens qui pensaient que Google ignorait toujours le lastmod, et bien cela a changé. Comme le dit Gary Illyes « les choses peuvent changer si on leur en laisse le temps…. »

Renseigner le lastmod, oui, mais le renseigner correctement

Google a toujours tendance à ne pas faire confiance aux informations « déclarées » par les propriétaires de sites. Leur réflexe est toujours de vérifier si l’information transmise est la réalité.

S’agissant des sitemaps XML :

  • si vous transmettez des lastmod fantaisistes => Google cessera de prendre en compte les sitemaps pour définir sa stratégie de recrawl. Il se basera sur les infos qu’il récupère lors de l’exploration des pages du site.
  • si vous transmettez des lastmod pertinents => Google fera confiance à l’information de vos sitemaps, qui seront analysés beaucoup plus souvent, et cela peut améliorer de manière significative l’efficacité du crawl de Googlebot.

Mais ce serait quoi, un lastmod fantaisiste ?

En pratique il y’a deux cas classiques :

  • le lastmod ne change pas, alors que le contenu de la page est différent
  • le lastmod est mis à jour à chaque régénération de la page, ou du sitemap, alors que le contenu de la page n’a pas changé

Les spécifications du consortium sitemaps.org définissant la valeur attendue de l’attribut lastmod. L’absence de « lastmod » n’invalide pas le format du fichier (d’où le caractère « facultatif » de l’attribut). Par contre le renseigner est devenu plus que recommandé si vous voulez que vos sitemaps XML servent à quelque chose…

Comment bien gérer le lastmod des sitemaps XML sur un site WordPress ?

Fabrice Canel de Bing, et Gary Illyes de Google viennent de préconiser la montée en version de tous les utilisateurs de WordPress pour passer au moins à la 6.5.

La raison ? La version 6.5 de WordPress gère correctement la génération d’un lastmod avec une valeur correcte dans le sitemap XML, et ceci de manière native.

Gary Illyes a publié cette recommandation sur un post sur linkedin

https://www.linkedin.com/posts/garyillyes_the-lastmod-element-in-sitemaps-is-a-signal-activity-7198704853777285120-2-Se/

Et au passage, cela leur a donné l’occasion de rappeler l’importance, et l’intérêt, de bien gérer cet attribut.

Si vous ne l’avez pas déjà fait, je vous invite donc à contrôler la cohérence de vos « lastmod ».

Laisser un commentaire