Google a détecté 40 milliards de pages de spam par jour en 2020 !

Cela ne devrait étonner personne, le nombre de pages de spam est en augmentation. D’après le dernier rapport de Google sur la question, le phénomène est même en croissance rapide.

Entre 2019 et 2020, le nombre de pages de spam détectées par Google a augmenté de 60%

how we defend against spam at every step

Lorsque Google cherche à crawler et indexer les pages du web, ils rencontrent un volume de plus en plus important de pages de spam.

La progression annoncée pour le volume de pages spammy détectées reste spectaculaire : elle est de 60% en un an, entre 2019 et 2020 !

Google ne donne aucun indicateur sur l’augmentation de la proportion de ce qu’il considère comme du spam rapporté au volume de pages web qu’il explore.

Car il est possible que cette augmentation provienne des progrès de Google en matière de détection des pages de spam. Par exemple, Google explique qu’ils ont augmenté leur capacité de détection de pages de spam provenant de sites hackés d’un bon 50% !

Ils indiquent également que l’emploi de l’intelligence artificielle a réduit en deux ans de 80% le nombre de pages de spam construites à base de scraping et de génération de textes automatiques dans son index. (mais je suis persuadé que les SEO black hat ont un autre ressenti par rapport à cette affirmation).

La lutte entre spammers et moteurs de recherche fait rage

Chaque année, Google se targue d’éliminer de plus en plus de pages de spam (en volume). Chaque année ils font des progrès dans la détection et l’élimination des pages de spam. En parallèle, les spammers progressent également dans les méthodes de création de spam. Certains d’entre eux utilisent aussi des techniques à base d’IA.

C’est donc l’éternelle lutte de l’épée contre le bouclier.

S’il faut retenir quelque chose de ces annonces et de ces chiffres, c’est

  • qu’il est de plus en plus inefficace d’utiliser des méthodes de « bourrin » à l’ancienne (pages avec du contenu scrapé, content spinning facile à détecter, gloubi boulga de termes sans queue ni tête). Beaucoup de ces pages risquent de finir étiquetées comme du webspam
  • et que les spammers sont de plus en plus nombreux à hacker les sites « normaux » pour parvenir à leurs fins : il est donc important de bien suivre les consignes pour protéger vos sites

Le rapport 2020 de Google sur la détection du webspam

https://developers.google.com/search/blog/2021/04/how-we-fought-search-spam-2020

Les conseils de Google pour protéger votre site contre les hackers :

https://developers.google.com/web/fundamentals/security/hacked/top_ways_websites_get_hacked_by_spammers

https://developers.google.com/web/fundamentals/security/hacked

Une video d’aide qui explique quoi faire si votre site est hacké

Une petite video de Google sur la luttte contre le webspam :

Laisser un commentaire