Attributs nofollow ugc sponsored ? Lesquels utiliser et où ?

Il y’a 16 ans, Google introduisait l’usage de l’attribut « nofollow » sur l’attribut « rel » sur les balises « <a>. En 2005, l’idée était de permettre aux webmasters de déclarer qu’il ne fallait pas que Googlebot suive ces liens. Cela signifiait aussi que le webmaster ne souhaitait pas que ces liens soient pris en compte dans le calcul du pagerank.

L’objectif était de permettre de fixer des règles plus claires concernant les liens achetés ou manipulés : dorénavant, si un lien manipulé figurait sur un site et comportait dans un rel=’nofollow », alors il n’y avait plus violation des guidelines de Google.

Bien sûr, cela a ouvert la possibilité pour Google d’infliger plus sereinement des actions manuelles pour liens manipulés : avant, il n’existait pas de solutions permettant aux webmasters d’indiquer quels liens étaient sponsorisés ou non. Donc c’était difficile de reprocher aux propriétaires de sites de manipuler le pagerank sans leur donner la possibilité d’annuler l’impact des liens sponsorisés.

Et sans surprise, quelques mois plus tard en 2007, les actions manuelles ont commencé à pleuvoir !

Mais très vite, des effets de bord sont apparus, que les ingénieurs de Google n’avaient pas été prévus.

Premier effet de bord : le pagerank sculpting à l’aide de l’attribut nofollow

Très vite, certains spécialistes SEO ont vu les « rel=’nofollow' » comme une aubaine : il était devenu possible de contrôler lien par lien ce Google explore. C’était donc une possibilité nouvelle, car jusqu’ici, le crawl se pilotait au niveau de l’url entière, soit via les directives du fichier robots.txt, soit par la balise meta=’robots ». La valeur « nofollow » dans la balise meta=’robots’ rend tous les liens de la page non crawlables…

Cela permettait donc de faire du Pagerank Sculpting à l’aide de l’attribut nofollow. Auparavant, il fallait utiliser des ruses pour masquer les liens non désirés (comme obfusquer les liens en javascript).

En quelques mois, de nombreux sites internet ont ajouté des liens dotés d’un attribut nofollow dans leur footer (sur les urls des pages de mentions légales, ou les conditions générales de vente), pour éviter de « transmettre du PR à des pages inutiles pour permettre au PR de se concentrer sur les pages utiles ». En fait, le PR Sculpting pratiqué de manière aussi naive n’a jamais réellement fonctionné, mais la méthode est devenue populaire.

Matt Cutts, qui s’est rendu compte qu’ils avaient engendré un effet de bord monstrueux, a donc décidé en 2009 avec les ingénieurs de Google de changer la façon dont les liens internes dotés d’un rel=’nofollow’ transmettaient du PR.

Avant : ils n’étaient pas pris en compte dans le calcul du PR transmis, et le PR Scupting pouvait théoriquement marcher

Après : ils étaient pris en compte, et le PR transmis était diminué (et le PR transmis à l’url en nofollow était perdu pour le reste du site). L’utilisation du PR Sculpting à base de nofollow n’était plus simplement peu efficace, mais carrément antiproductif !

Conclusion : aujourd’hui encore, utiliser des nofollow sur des liens internes fait perdre du pagerank à vos sites.

Avoir des liens dotés de rel=’nofollow’ sur vos liens internes n’a aucun sens ! Si vous en avez, il faut supprimer cela tout de suite… Nous sommes en 2021, pas en 2009.

Pour en savoir plus, notre article sur le sujet :

Deuxième effet de bord : trop de nofollow nuit à l’exploration

Le succès du nofollow chez les propriétaires de sites a engendré d’autres effets de bord. La peur des « fuites de pagerank » (souvent irrationnelles) a conduit à la mise en place de pratiques populaires, comme l’ajout de rel=nofollow sur tous les commentaires sur les blogs ou les sites, dans tous les messages de forums, ou les avis. Bref, le nofollow était utilisé pour éviter le spam de forums ou de commentaires, pas pour « marquer » les liens manipulés.

Google s’est rendu compte que l’influence de ces nofollow sur son exploration du web commençait à être gênante. Car dans les contenus UGC (User Generated Content : contenus générés par les utilisateurs), se trouvent souvent des liens dont la non prise en compte biaise fortement tous les signaux indépendants des requêtes qu’il cherche à collecter, et notamment : le pagerank.

Le phénomène a pris une telle ampleur que les ingénieurs de Google se sont dit : « il faut que le nofollow cesse d’être une directive impérative. Nous devons recouvrer le droit de crawler ces contenus. Et il faut que les webmasters puissent marquer différemment les liens dans les contenus UGC et les liens marqués parce qu’ils sont payants ou manipulés. »

Contre mesure : la création des valeurs d’attribut « ugc » et « sponsored »

En septembre 2019, Google a donc annoncé l’introduction de deux nouvelles valeurs pour l’attribut rel : sponsored, et ugc. Nofollow est conservé pour des raisons de rétrocompatibilité. Les valeurs ugc et sponsored sont officiellement valides depuis mars 2020.

  • rel= »sponsored » permet de marquer les liens publicitaires ou payants. Google peut ainsi repérer les liens qui étaient ciblés par en 2005 par l’attribut nofollow. Ces liens étant mieux identifiés, cela permettra à Google de ne pas en tenir compte dans son exploration et dans son calcul du pagerank.
  • rel= »ugc » permet de marquer les liens figurant dans les contenus générés par les utilisateurs (commentaires, messages de forum, avis etc…). Ces liens peuvent être explorés par Google, qui peut également décider de les prendre en compte (ou pas) dans son calcul du pagerank.

En juillet 2021, comment utiliser les valeurs d’attribut nofollow, ugc et sponsored ?

L’adoption du rel=ugc/sponsored est très, très limitée à la date de rédaction de l’article. Pour le moment, un an après sa mise en place, Google n’a toujours pas entrepris d’exploiter l’information apportée par ce nouveau balisage. John Mueller l’a confirmé récemment :

Donc à date toutes les valeurs sont considérées comme des nofollow.

Par contre, le statut du nofollow a changé : c’était une directive, que Google devait suivre impérativement. Depuis mars 2020, le rel=’nofollow’ est une indication (a hint), que Google peut prendre en compte ou non selon son bon vouloir (même chose que pour une rel=’canonical’).

En règle générale, les liens en « nofollow » ne sont pas suivis par Google, mais il existe maintenant des exceptions (sur l’UGC).

Faut-il changer votre balisage ?

Du coup, faut-il changer votre balisage ?

Ce serait beaucoup de travail pour pas grand chose :

  • si vous avez l’occasion de le faire lors d’une refonte du code front de vos sites web : oui, remplacez vos nofollow par des rel=ugc ou rel=sponsored, cela permettra à Google de mieux comprendre le contenu de votre site.
  • sinon… gardez vos nofollow tels qu’ils sont. Il n’est même pas certain que Google exploitera sérieusement ce balisage, qui connaîtra peut être le même sort que rel=author, que Google a laissé tomber après quelques années d’expérimentation infructeuse.

Rappel : la valeur « dofollow » n’existe pas. On parle de liens en « dofollow » dans le jargon du SEO, mais c’est du jargon. Cela signifie des liens qui transmettent du pagerank, contrairement aux liens avec un nofollow. Mais pour qu’un lien soit en dofollow, il suffit de ne pas mettre d’attribut rel=’nofollow » (ou ugc, ou sponsored). Ajouter un attribut rel=’dofollow’ est une cuistrerie. Mais on voit cela dans le code régulièrement (si, si). On trouve cela aussi dans des articles d’agences SEO qui se veulent sérieuses (??) : tapez dans Google « rel=dofollow » et vous allez voir plein de gens pensent que cette valeur d’attribut existe ! Une simple vérification dans les références W3C ou sur les pages support de Google permet pourtant de se rendre compte que « dofollow » n’est mentionné nulle part.

La page d’aide de Google sur les valeurs d’attribut nofollow, ugc et sponsored :

https://developers.google.com/search/blog/2019/09/evolving-nofollow-new-ways-to-identify#can-i-use-more-than-one-rel-value-on-a-link

Laisser un commentaire