Comment Google exploite les « anchor texts » dans son algorithme ?

Les « anchor text » (« textes d’ancre » en français), sont les textes cliquables placés entre les balises <a …> et </a> en langage HTML. On les appelle aussi parfois « textes de lien » :

exemple <a href='https://www.monsite.com>Ceci est un texte d'ancre</a> 

Les textes d’ancre jouent un rôle important en SEO, car les moteurs de recherche comme Google en font usage pour améliorer la pertinence de leurs résultats : ils indexent ces bouts de texte, au même titre que le contenu de la page vers laquelle le lien associé à l’anchor text pointe.

Il est donc possible de positionner une page sur un mot clé qui figure dans un texte d’ancre pointant vers la page, sans que ce mot figure sur la page elle même. C’est cette caractéristique qui rend possible les « Google Bombings ».

Le rôle des anchor texts ne fait pas débat dans la communauté SEO, par contre beaucoup se posent des questions sur les mots clés qui entourent ces textes d’ancre :

mots clés avant <a href='https://www.monsite.com>Ceci est un texte d'ancre</a> mots clés après

En langage savant, on appelle cela un « extended anchor text » : le texte d’ancre étendu (en bleu dans l’exemple ci-dessus)

Lorsqu’on étudie la littérature sur la Recherche d’Information (avec des majuscules, je fais allusion ici à ce que les anglo saxons appellent l’Information Retrieval, la science qui sert à fabriquer les moteurs de recherche), on s’aperçoit qu’exploiter ces textes d’ancre étendus est quelque chose qui a été testé, et approuvé.

ex :

https://nlp.stanford.edu/IR-book/html/htmledition/anchor-text-and-the-web-graph-1.html

Cela sert aussi bien à détecter le linkspam, à « deviner » ce qu’un crawler va télécharger en suivant un lien, ou à améliorer la pertinence (mais en accordant un poids beaucoup plus réduit aux mots clés avant ou après l’anchor text qu’à ceux figurant dans le texte d’ancre). Il y’a même eu des papiers scientifiques pour évaluer les différentes tailles de « fenêtre » à retenir autour du texte d’ancre.

Questionné sur le rôle éventuel que jouerait le texte d’ancre étendu dans l’algorithme, John Mueller a répondu de manière un peu ambigue mais par l’affirmative :

“Can Google kind of get context for like the text around that link, maybe if it doesn’t have any?”

Et la réponse de John Mueller

“Sure. But that’s more kind of secondary. Like that really strong piece of context from the anchor text that’s missing in that case »

Conclusion : oui, Google tient compte du texte d’ancre étendu dans son algorithme, mais les termes contenus avant et après le texte d’ancre ont un faible poids dans l’algorithme.

Il est probable que Google indexe le texte d’ancre étendu depuis le lancement du moteur. Dans la publication scientifique où Larry Page et Serguei Brin décrivaient le moteur Google en 1998, ils annonçaient qu’ils comptaient introduire cette fonctionnalité dans le moteur.

Dans le passé, les tests de vérification de l’exploitation du texte étendu par le moteur Google ont toujours confirmé que c’était bien le cas.

Nous allons renouveler le test chez Neper (au cas où) : affaire à suivre…

PS : il existe également un brevet déposé par Google, mis à jour récemment, qui introduit plusieurs autres utilisations potentielles de ces textes d’ancre à des fins diverses :

http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.htm&r=1&f=G&l=50&s1=10,210,256.PN.&OS=PN/10,210,256&RS=PN/10,210,256

Attention : le fait que Google ait déposé un brevet ne signifie pas qu’ils utilisent vraiment l’approche décrite dans leur moteur.

Laisser un commentaire