Google I/O, la conférence phare du géant de Mountain View, vient de s’achever… et a été particulièrement riche en annonces. Comme prévu, l’événement s’est fortement concentré sur Gemini, le modèle d’Intelligence Artificielle de Google, ainsi que sur son intégration dans des applications comme Workspace et Chrome.
Si vous n’avez pas pu suivre l’événement en direct, on vous résume dans cet article les grandes annonces qui vont de Google Lens à Gemini en passant par Veo et le projet Astra.
Sommaire
Google Lens vous permet désormais de faire des recherches vidéo
Google Lens permet déjà de lancer des recherches sur Google à partir d’images. Désormais, Google va plus loin en ajoutant la possibilité de réaliser une requête sur le moteur de recherche avec une vidéo.
Concrètement, vous pouvez filmer quelque chose que vous souhaitez rechercher, poser une question pendant la vidéo, et l’IA de Google tentera de trouver des réponses pertinentes sur le web.
Gemini répondra aux questions sur votre galerie de photos
Google lance cet été une nouvelle fonctionnalité qui pourrait être bénéfique pour tous ceux qui ont des années, voire plus d’une décennie de photos à trier.
« Ask Photos » permet à Gemini, le chatbot IA de Google, d’explorer votre bibliothèque Google Photos pour rechercher une photo spécifique, voire une information contenue dans une photo, au fin fond de la galerie.
Sundar Pichai, PDG de Google, a d’ailleurs fait une démo assez impressionnante. Il a demandé à Gemini le numéro de plaque d’immatriculation de son véhicule… une information qui se trouvait sur une photo dans le smartphone du PDG. Gemini a même sorti la photo en question pour argumenter sa réponse.
Le modèle phare de Gemini devient plus rapide et plus performant
Google a introduit un nouveau modèle d’IA dans sa gamme : Gemini 1.5 Flash. Ce modèle multimodal est tout aussi puissant que Gemini 1.5 Pro, mais il a été optimisé pour des tâches « pointues, à haute fréquence et à faible latence ». Il devient plus rapide pour générer des réponses aux questions du quotidien.
Google a également apporté des modifications à Gemini 1.5 pour améliorer ses capacités de traduction, de raisonnement et de codage. On apprend également que la fenêtre contextuelle de Gemini 1.5 Pro (la quantité d’informations qu’il peut traiter) a été doublée, passant d’un million à deux millions de tokens.
Gemini intègre les utilisateurs dans Workspace
L’entreprise intègre son dernier modèle grand public, Gemini 1.5 Pro, dans la barre latérale de Docs, Sheets, Slides, Drive et Gmail.
Lorsqu’il sera disponible pour les abonnés payants, probablement dès juin 2024, il deviendra un assistant généraliste au sein de Workspace, capable de récupérer des informations de tout le contenu de votre Drive, où que vous soyez.
Il pourra également accomplir des tâches pour vous, comme rédiger des emails en intégrant des informations d’un document que vous consultez ou vous rappeler de répondre à un email avec une suggestion de texte. Certains testeurs ont déjà accès à ces fonctionnalités.
Project Astra, l’avenir de l’IA de Google ?
Le projet Astra de Google est un assistant multimodal que l’entreprise espère transformer en un assistant virtuel polyvalent capable de voir et comprendre ce qu’il observe à travers la caméra de votre smartphone, de se souvenir de l’emplacement de vos objets et de réaliser diverses tâches pour vous.
Ce projet a d’ailleurs fait l’objet de la majorité des démonstrations les plus impressionnantes de cette année à la conférence I/O. L’objectif de Google est d’en faire un véritable agent IA capable de vous parler, « mais aussi d’agir en votre nom ». À suivre !
Veo, la solution de Google pour générer des vidéos
La réponse de Google à Sora, l’outil de génération de vidéos d’OpenAI, est sortie. Il s’agit d’un nouveau modèle d’IA générative capable de produire des vidéos en 1080p à partir de textes, d’images et de vidéos.
Les vidéos qu’il produit peuvent être réalisées dans une variété de styles, comme des prises de vue aériennes ou des timelapses, et peuvent être ajustées avec des instructions supplémentaires.
Google a déjà donné l’accès à Veo à certains créateurs sur YouTube. Le géant de la tech compte également présenter cet outil à Hollywood dans un avenir proche.
Gems permet de créer des chatbots personnalisés dans Gemini
Google lance un créateur de chatbots personnalisés, sobrement appelé Gems. À l’instar des GPTs d’OpenAI, Gems permet aux utilisateurs de donner des instructions à Gemini pour personnaliser ses réponses. Cette fonctionnalité est réservée aux abonnés à Gemini Advanced.
Chrome se dote d’un assistant IA
Google a annoncé l’intégration de Gemini Nano, la version allégée de son modèle Gemini, dans la version Desktop de son navigateur Chrome. Cet assistant intégré utilisera l’IA sur l’appareil pour vous aider à générer du texte pour des publications sur les réseaux sociaux, des avis de produits, etc.