Les assistants IA de Google veulent accompagner les utilisateurs partout
Google a présenté mardi ses dernières innovations en intelligence artificielle (IA) générative, qui vont potentiellement transformer le quotidien de ses utilisateurs, de la recherche en ligne à de nombreuses tâches du quotidien, grâce à des assistants toujours plus omniscients.
"Nous n'en sommes encore qu'au tout début de la transition vers l'ère de l'IA", a rappelé d'emblée Sundar Pichai, le patron de Google, sur la scène de l'amphithéâtre en plein air de l'entreprise à Mountain View (Californie).
Le géant américain des technologies tenait mardi sa conférence annuelle pour les développeurs, sous le signe de l'IA générative (production de contenus sur simple requête en langage courant).
Selon Sundar Pichai, "la transformation la plus excitante, c'est évidemment la recherche en ligne générative sur Google".
Google testait déjà depuis un an sa nouvelle approche: en haut de la page de résultats, l'internaute reçoit une réponse rédigée à sa question, générée par Gemini, le modèle d'IA de Google. Il peut ensuite cliquer sur des suggestions de questions additionnelles, ou, plus bas, sur les liens traditionnels vers des sites web.
Des tests concluants, d'après le dirigeant : "les utilisateurs font plus de recherches et sont plus satisfaits", a-t-il assuré.
La nouvelle formule - la transformation la plus importante du moteur de recherche depuis sa création - va être déployée aux Etats-Unis dès cette semaine, puis dans d'autres pays, pour atteindre plus d'un milliard de personnes d'ici la fin de l'année.
"A l'ère de Gemini (...) Google fait le travail pour vous", a promis Liz Reid, la responsable de Google Search.
Elle a montré comment les nouveaux outils d'IA générative facilitent la vie des utilisateurs, qu'ils cherchent un studio de yoga ou qu'ils planifient tout un voyage.
- Recherche menacée -
Google domine la recherche en ligne au point que son nom est synonyme de l'action.
Début 2023, grâce à ses investissements massifs dans OpenAI (ChatGPT), Microsoft a ajouté de l'IA générative à Bing, son moteur de recherche. En vain: Google est resté la référence.
Mais la révolution technologique en cours pourrait quand même le menacer. Toute la Silicon Valley rivalise de nouveaux outils et assistants d'IA, qui permettent de contourner le numéro un mondial de la publicité numérique.
Sur Facebook, Instagram et WhatsApp par exemple, les utilisateurs peuvent poser des questions à Meta AI, qui a désormais accès à internet.
Le cabinet d'analyse stratégique Gartner prédit que d'ici 2026, le volume de requêtes adressées aux moteurs de recherche traditionnels chutera de 25%, au fur et à mesure sur les chatbots et assistants IA comme ChatGPT et d'autres grignotent des parts de marché.
La bataille se déplace donc vers ces assistants numériques, qui semblent gagner de nouveaux super pouvoirs toutes les semaines.
Notamment grâce aux progrès des modèles d'IA générative.
Celui de Google, Gemini 1.5 Pro, va pouvoir prendre en compte plus d'informations de contexte apportées par l'utilisateur (centaines de pages de texte, vidéos plus longues, etc.) et gagner en multimodalité (le modèle "comprend" aussi bien du texte, que du son et des images, et peut répondre à l'écrit, par la voix ou en générant des images).
- "Conversations en profondeur" -
Au-delà des capacités techniques, Sundar Pichai a présenté sa vision pour l'avenir: les agents d'IA seront "des systèmes intelligents capables de raisonner, de planifier et de retenir des informations. Ils anticipent les étapes et savent travailler avec des logiciels pour accomplir des choses en votre nom, sous votre supervision".
La société qui a réalisé près de 74 milliards de dollars de profits l'année dernière, investit tous azimuts pour donner corps à cette vision.
Mardi, elle a présenté "Gemini Live", qui permettra d'avoir des "conversations en profondeur avec Gemini", à l'oral, via l'application mobile.
Plus tard cette année, l'assistant doit gagner en compétences grâce aux avancées de Project Astra, un prototype d'agent d'IA.
Le laboratoire de recherche de Google, DeepMind, a diffusé une démonstration vidéo d'Astra, accueillie avec enthousiasme par le public.
On y voit un utilisateur pointer la caméra de son smartphone - ou des lunettes avec caméra intégrée - sur son environnement, et interroger le modèle, qui identifie correctement le lieu où il se trouve, résout un problème informatique à partir d'un schéma et se souvient où il a posé un objet.
Lundi, OpenAI a réalisé une présentation similaire, où ChatGPT interagit avec un ingénieur d'une façon si naturelle que la machine semble humaine.
Mais la fluidité de la conversation ne fait pas encore des chatbots des agents d'IA omniscients, proactifs et personnalisés.
Google DeepMind a présenté d'autres nouveaux modèles, Gemini 1.5 Flash (plus rapide et moins coûteux), Imagen 3 (génération d'images) et Veo (génération de vidéos, un secteur de l'IA générative en plein essor).
G.Muller--LiLuX