Décidément, les démonstrations de produit ne sont pas le fort de Google. Après avoir complètement raté l’exercice en février dernier pour Bard, son chatbot, voilà que la firme de Mountain View se voit accusée de tromperie suite à la démo de Gemini, son nouveau modèle IA.
GeminiGate… ou l’histoire d’une démo traficotée
Le 7 décembre dernier, la démo de Gemini, le nouveau modèle d’intelligence artificielle de Google, a largement été acclamée par la communauté Tech. Aujourd’hui, de nombreuses voix s’élèvent pour dénoncer « une mascarade ».
Dans la vidéo de six minutes, vue plus de 2.1 millions de fois sur YouTube, Gemini semble interagir de manière fluide et en temps réel avec la voix d’un opérateur humain. On y voit l’analyse d’un dessin de canard, la reconnaissances des gestes de la main de l’opérateur et la création spontanée d’un jeu intitulé « Guess the Country » (Devinez le pays) à partir d’une simple mappemonde.
Quelques jours après cette prouesse, Oriol Vinyals, cadre de Google DeepMind, a souhaité nuancer la performance. Si les interactions montrées dans la vidéo sont bien réelles, elles ont été « raccourcies pour plus de concision ». En réalité, les échanges de Gemini étaient basés sur du texte, que l’on ne voyait pas à l’écran, et non sur la parole. Aussi, la technologie prenait (beaucoup) plus de temps à réagir que ce qui est montré dans la démo.
Google a même ajouté un disclaimer à sa vidéo YouTube : « Pour les besoins de cette démo, la latence a été réduite et les réponses de Gemini ont été abrégées pour plus de concision ». Cette précision n’a pas empêché une vague de critiques sur les réseaux sociaux.
« Un certain degré de marketing est nécessaire pour promouvoir de tels produits »
Même des employés de Google ont exprimé des réserves sur la démo diffusée. Un employé a confié à Bloomberg que la vidéo donnait une image irréaliste de Gemini et montrait « combien il est facile de faire paraître un outil d’IA plus avancé qu’il ne l’est en réalité ». Le PDG de Google, Sundar Pichai, n’a fait aucune mention de ces « ajustements » dans sa publication du 7 décembre.
Un autre employé de Google a déclaré ne pas être particulièrement surpris par le traitement de la démo, estimant qu’un « certain degré de marketing est nécessaire pour promouvoir de tels produits ». Ce dernier a ajouté que les réponses de Gemini n’ont pas été inventées, mais simplement raccourcies, et que la voix off lisait des extraits de prompts textuels.
Lors de sa sortie, la démo de Gemini avait reçu des réactions dithyrambiques. « La nouvelle IA Gemini de Google observe un homme dessiner un canard et explique ce qu’il fait à chaque étape – pas seulement de manière littérale ou mécanique, elle peut inférer ce que l’homme a l’intention de faire, pourquoi il fait ce qu’il fait. Cela semble… très humain », avait déclaré Armand Domalewski, analyste de données chez Palo Alto Networks, dans une publication du 7 décembre.
Lancé en grande pompe pour concurrencer ChatGPT, Gemini est censé surpasser les principaux modèles IA dans 30 des 32 benchmarks testant le raisonnement, les mathématiques, la langue, etc. Selon Google, Gemini dépasse GPT-4 dans sept benchmarks structurels (sur huit).