Google lance FLOC (Federated Learning of Cohorts), une alternative aux cookies

Le compte à rebours est en train de tourner : il ne reste que quelques mois avant que l’immense majorité des navigateurs cessent de supporter les cookies tiers (événement prévu en 2022).

Il faudrait un article entier (que je vous promet d’écrire prochainement) pour exposer toutes les conséquences que la disparition du support des cookies tiers aura pour l’écosystème web. Mais cela risque d’être violent tant cela va obliger tout le monde à revoir ses habitudes et tant cela va mettre à mal des modèles économiques entiers.

Mais surtout, le manque de préparation de la plupart des acteurs du web est frappant. La plupart ne sont pas au courant de ces changements, ou le savent mais n’ont pas lancé de plan pour basculer vers des alternatives aux cookies tiers, ou collecter des données dites « First Party », qui elles pourront toujours être utilisées.

Il faut dire à la décharge de tout le monde que jusqu’ici, aucune solution alternative crédible n’a émergé. Plusieurs acteurs ont lancé des initiatives, mais sans que ces solutions apparaissent comme réellement convaincantes. On peut citer les solutions proposées par Criteo, NextRoll, Magnite et RTB House.

Les équipes de Chrome ont poussé leur propre solution, FLEDGE, sans que cela déclenche non plus un véritable enthousiasme. Et encore moins l’adhésion des acteurs du web.

Mais voilà que Google annonce le lancement de sa propre initiative : FLOC (Federated Learning of Cohorts). Est-ce que nous sommes cette fois ci face à une alternative crédible ?

FLOC : Quand Google propose de ne plus gérer des utilisateurs, mais des « troupeaux » d’utilisateurs

L’acronyme FLOC n’a pas été choisi par hasard, c’est un jeu de mot avec « flock » qui signifie troupeau en anglais. Le terme est clairement familier, dans les papiers scientifiques qui décrivent les algorithmes de FLOC, les auteurs préfèrent utiliser le terme « cohorte » qui sert, en statistiques, à désigner un groupe d’individus que l’on analyse en commun.

L’idée derrière FLOC, c’est de créer une approche qui permet :

  • d’anonymiser efficacement les données d’utilisateur, en « cachant » les utilisateurs au milieu d’un « troupeau » de personnes partageant les mêmes comportements. Les données sont codées en créant un vecteur de coordonnées encodant les préférences et les comportements, et en générant ensuite une signature numérique à l’aide simHash qui identifiera un troupeau partageant un nombre suffisant de caractéristiques communes
  • les troupeaux sont formés à partir d’algorithmes de clustering non supervisés. Plusieurs méthodes sont à l’étude encore au moment où cette initiative est lancée.
Le principe des cohortes de « Floc » illustré

Est-ce une bonne solution ?

Il est encore trop tôt pour dire si cette idée peut aboutir se transformer en une approche largement utilisée. Car on est encore plus proche de l’idée ou du concept que d’une solution aboutie.

Mais FLOC a quelques avantages par rapport aux solutions envisagées jusqu’ici :

  • ce n’est pas une solution propriétaire. Tous les sites ayant des données peuvent exploiter cette approche
  • la création de « troupeaux » (cohortes) est théoriquement simple
  • sur le papier, cela permettrait de faire un ciblage publicitaire suffisamment précis pour que les campagnes restent efficaces. Par contre, il est clair qu’au delà d’une certaine granularité de campagne, plus rien ne sera possible. Donc FLOC ne remplace pas le besoin de données First Party pour les sites qui veulent cibler des utilisateurs précis, et on perd toujours la visibilité sur les données d’attribution contribution rendues disponibles jusqu’ici par les cookies tiers

Ceci dit, FLOC permettrait aussi à Google de réexploiter les données de navigation de Chrome pour créer des bases de « troupeaux » pour le ciblage publicitaire incontournables car sans équivalent sérieux.

Une fois de plus, il semble qu’avec la disparition des cookies tiers pour des raisons (légitimes) de protection des données privées, on s’achemine vers une dépendance encore plus forte de l’écosystème web envers les données fournies par les GAFAM.

Pour en savoir plus

https://blog.google/products/ads-commerce/2021-01-privacy-sandbox

Laisser un commentaire