Google I/O : une réponse point à point à Bing sur l’IA

L’événement Google I/O était hier soir, et c’était l’occasion pour Google de faire de nombreuses annonces sur ses produits et services. Et évidemment, beaucoup d’annonces avaient trait à l’IA.

A plusieurs reprises dans l’événement, les speakers ont évoqué une approche responsable de l’IA. C’était clairement une pierre dans le jardin d’OpenAI.

Nous aurons l’occasion de revenir dans quelques jours de manière détaillée sur chacune des annonces, notamment les services DUET, les outils workspace et les nouveaux services clouds, mais voici déjà ce qu’il fallait retenir de l’édition 2023 de Google I/O

Le récap de Google I/O 2023

PaLM 2 : la seconde génération d’un modèle multi-usages

La principale annonce c’était la mise à disposition en version preview du modèle PaLM version 2. Un modèle multimodal qui est déjà utilisé dans les versions de Bard qui seront poussées prochainement.

PaLM 2 a déjà été implémenté dans deux applications impressionnantes : SecPaLM (dédiée à la sécurité), et MedPaLM (dédiée aux diagnostics et l’expertise médicale).

S’agissant de MedPaLM, la nouvelle version propulsée par PaLM 2 a, selon Google, déjà dépassé le stade considéré comme suffisant pour être considérée comme l’équivalent d’un expert humain.

PaLM 2 existe dorénavant sous la forme de modèles plus ou moins compacts, auxquels Google a attribué des noms d’animaux. Le plus petit modèle est capable de tenir sur une device mobile, et de fonctionner sans connexion internet.

Ce nouveau modèle de langage dote Bard de capacités qui lui manquait au début :

  • une vraie capacité multimodale : c’est à dire la possibilité de manipuler aussi des images ou des vidéos en entrée, mais aussi dans ses réponses
  • une vraie capacité multilingue
  • une capacité de raisonnement logique : dans les données d’entrainement de PaLM, beaucoup de contenus de type logique et mathématique ont été ajoutées. Cela lui permet, contrairement à ChatGPT, de ne pas échouer lamentablement dans la génération d’une réponse qui demande un raisonnement logique.
  • et une capacité d’analyser du code, et d’en écrire dans une dizaine de langages de programmation courants

Bard déployé (en anglais) dans 180 pays sans liste d’attente

Jusqu’ici, pour tester Google Bard, il fallait s’inscrire sur une liste d’attente, et avoir une IP US.

Mais Bard va être prochainement déployé sur la plupart des versions pays de Google, mais en anglais uniquement.

Pour le moment, Bard est limité à trois langues : l’anglais, et (c’est nouveau) le japonais et le coréen

Et grâce à PaLM 2, Google Bard sait désormais coder !

Le retour des « Search Labs »

Les plus anciens se souviennent que Google a souvent expérimenté de nouvelles fonctionnalités dans une section appelée les Google Labs.

Google a ressuscité les labs pour le Search, et annoncé que dans quelques semaines les utilisateurs US allaient pouvoir y tester une nouvelle page de résultats propulsée par une IA générative (Bard version PaLM2)

Cette intégration (expérimentale) est très proche de celle proposée par Bing avec Bing Chat.

La réponse de Google Bard sur une requête shopping

On peut néanmoins remarquer trois différences :

  • la place réservée dans la page aux réponses de l’IA générative est très importante. Les « liens bleus » sont rejetés loin en dessous
  • il est possible de chatter directement dans la page (fonction « follow up ») ce qui rejette les liens bleus encore plus loin
  • les résultats sont multimodaux : ils incluent des images
  • il existe plusieurs types de réponse selon la nature de la requête : il y’a notamment un bloc de réponse dédiée au requêtes de type « shopping ».

Google va-t’il rattraper son retard sur Bing et Open AI ?

Ces annonces ont provoqué la hausse du cours de l’action Alphabet : les marchés ont considéré que Google démontrait qu’ils étaient capables de damer le pion à ses challengers : Bing et Open AI.

Stratégiquement, Google ne semble que réagir en proposant le même type d’innovations. Mais si l’on considère le peu de temps qu’il leur a fallu pour répondre, c’est quand même le signe que l’avance technologique de Microsoft et Open AI sur ces sujets n’est pas considérable (voire inexistante).

Google avait le choix entre différents LLM (Large Language Models) pour proposer des IA génératives. Pour le moment ils privilégient PaLM. Sundar Pichai, le CEO, a également évoqué le modèle Gemini, qui serait la prochaine génération de modèle.

La course entre Microsoft et Google va donc continuer dans les mois qui viennent, mais d’ici la fin de l’année, il n’est pas sûr que la firme de Mountain View soit encore considérée comme en retard sur ses concurrents.

Laisser un commentaire