Ce que le Brevet US11769017B1 Révèle sur le Fonctionnement des AI Overviews

Le brevet US11769017B1 publié par Google en mars 2023 offre un aperçu unique des mécanismes techniques qui sous-tendent les AI Overviews. Car le système qu’il décrit ressemble tellement aux aperçus IA qu’il est dfficile de ne pas faire le rapprochement sur la fonctionnalité qui a fait son apparition dans les labs quelques semaines après (sous le nom de Search Generative Experience)

Mais comme d’habitude, il y’a des différences entre le brevet et l’implémentation réelle. Nous allons donc voir d’une part ce que le brevet peut apporter comme éclairages sur le fonctionnement des AIOs. Mais dans un deuxième temps, nous

Architecture de Sélection des Sources : Les Révélations du Brevet

Le brevet révèle que Google avait conçu un système de sélection des documents sources bien plus sophistiqué que ce qui est actuellement déployé. L’architecture prévoit quatre catégories distinctes de Search Result Documents (SRDs), chacune répondant à des logiques spécifiques.

Les query-responsive SRDs constituent la base classique, mais leur sélection combine trois types de métriques :

  • query-dependent measures (ranking, taux de sélection spécifique, adaptation géographique),
  • query-independent measures (fiabilité, fraîcheur, popularité globale)
  • et user-dependent measures basées sur le profil et l’historique utilisateur.

Différence détectée : Les AI Overviews actuelles ne montrent aucune adaptation basée sur les user-dependent measures. Tous les utilisateurs reçoivent des réponses identiques, suggérant l’abandon de cette personnalisation sophistiquée.

Mécanismes de Corrélation Inter-Requêtes

Le brevet décrit ensuite l’intégration de related-query-responsive SRDs, sélectionnés selon les patterns de recherche séquentielle. Le système analyse « la quantité d’occurrences de la requête et de la requête liée émises par un appareil ou compte correspondant dans une proximité temporelle ».

Cette innovation permet d’enrichir les réponses avec des informations connexes issues de requêtes fréquemment associées. Si de nombreux utilisateurs cherchent « installation Docker » puis « erreur port 8080 », les documents sur les ports enrichissent automatiquement les futures réponses Docker.

Différence détectée : Bien que Google confirme utiliser une « query fan-out technique », l’implémentation semble beaucoup plus basique que le système de corrélation temporelle décrit dans le brevet.

Le processus de génération du « résumé basé sur du langage naturel » d’après le brevet

Adaptation Contextuelle et Requêtes Implicites

Le brevet révèle deux mécanismes avancés d’adaptation contextuelle. Les recent-query-responsive SRDs exploitent l’historique de session pour maintenir une cohérence, adaptant le niveau technique selon les recherches antérieures de l’utilisateur.

Plus innovant encore, le système génère automatiquement des implied-query-responsive SRDs basés sur le contexte et les données de profil, anticipant des besoins informationnels non explicitement exprimés.

Différence détectée : Aucun mécanisme d’adaptation contextuelle n’est observable dans les AI Overviews actuelles. Les réponses ne s’adaptent pas selon l’historique de recherche ou le niveau d’expertise présumé de l’utilisateur.

Mécanismes d’Apprentissage Post-Interaction

L’une des révélations les plus intéressantes du brevet concerne l’adaptation dynamique des résumés selon les interactions utilisateur. Le système surveille les clics sur les documents sources et génère des « revised NL based summaries » qui reflètent cette familiarité acquise.

Le brevet décrit précisément comment le système traite ces interactions : « le résumé révisé sera mis à jour pour refléter cette familiarité » en omettant les contenus déjà consultés ou en approfondissant les aspects non couverts.

Différence détectée : Les AI Overviews actuelles demeurent complètement statiques. Aucun mécanisme d’évolution post-interaction n’est implémenté, éliminant cette fonctionnalité d’apprentissage continu pourtant centrale dans le brevet.

Mécanismes de Vérification et Linkification

Le brevet révèle l’approche technique pour générer les liens de vérification. Le système utilise des identifiants de source uniques (S1, S2, S3) intégrés dans le prompt LLM, puis compare les embeddings des portions du résumé avec ceux des documents sources pour déterminer la vérifiabilité.

Cette approche automatisée permet de « comparer un embedding de la portion du résumé NL à un embedding d’une portion du SRD pour déterminer une mesure de distance » et créer automatiquement les liens appropriés.

Implémentation confirmée : Ce mécanisme semble effectivement déployé dans les AI Overviews actuelles, comme le montrent les liens numérotés (1, 2, 3) vers les sources de vérification.

La « linkification » ou l’ajout de sources numérotées et cliquables

Échecs des Mécanismes de Qualité

Le brevet décrit des mécanismes sophistiqués de filtrage basés sur des « trustworthiness measures » et la détection de contenu satirique. Ces systèmes devaient empêcher l’utilisation de sources peu fiables ou humoristiques.

Différence majeure détectée : Les incidents médiatisés de mai 2024 révèlent l’échec de ces mécanismes. Google a dû reconnaître que le système avait des difficultés à « interpréter les requêtes absurdes et le contenu satirique », notamment en utilisant des articles de The Onion comme sources factuelles.

Google a réagi en implémentant des « mécanismes de détection améliorés pour les requêtes absurdes » et en « limitant l’inclusion de contenu satirique et humoristique » – des correctifs défensifs non prévus dans l’architecture originale.

Implications pour l’Optimisation SEO

Ces révélations du brevet orientent les stratégies d’optimisation futures. L’absence actuelle de personnalisation simplifie l’optimisation puisque tous les utilisateurs voient les mêmes sources, mais cette uniformité concentre la compétition sur un nombre restreint de positions.

Les critères de sélection révélés par le brevet prioritent la fiabilité éditoriale (auteur identifiable, domaine autoritaire, sources citées), la fraîcheur temporelle (dates explicites, mises à jour régulières) et la structuration pour l’extraction automatique.

Anticipation stratégique : L’écart entre brevet et réalité suggère une évolution probable vers plus de sophistication. Les sites qui structurent déjà leur contenu pour supporter les mécanismes de personnalisation décrits dans le brevet (contenus modulaires, signaux d’autorité thématique) pourraient bénéficier d’un avantage concurrentiel lors de leur éventuel déploiement.

Les AIO ont été simplifiées par rapport au brevet

L’analyse du brevet révèle finalement les contraintes réelles du déploiement à grande échelle. Google a visiblement sacrifié les fonctionnalités les plus sophistiquées (personnalisation, adaptation dynamique, corrélation inter-requêtes) au profit de la stabilité opérationnelle et de la rapidité de déploiement.

Cette simplification illustre les défis classiques de transformation d’une innovation de laboratoire en service robuste pour des milliards d’utilisateurs.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.