Anthropic, la boîte spécialisée dans l’IA fondée par d’anciens salariés d’OpenAI, nous annonce que sa nouvelle famille de modèles IA, Claude 3, est au moins aussi performante, sinon plus, que les têtes de série de chez Google et OpenAI.
Petite nouveauté par rapport aux versions précédentes : Claude 3 joue sur plusieurs tableaux, puisqu’il est (enfin) capable de comprendre le texte et les images, comme ChatGPT 4. La promesse de la jeune pousse ? Claude 3 bat GPT-4 à plate couture, chiffres à l’appui. Voyons tout ça en détail…
Anthropic promet des chatbots plus coopératifs et moins naïfs
Claude 3, c’est la promesse de réponses à plus de questions, la capacité à comprendre des instructions beaucoup plus longues avec davantage de précision. Cette nouvelle itération semble plus ouverte aux contextes complexes et nuancés et peut donc digérer plus d’informations en input. On a droit à Claude 3 Haiku (modèle ultra-rapide mais pas forcément ultra-intelligent), Claude 3 Sonnet (le modèle de base) et Claude 3 Opus (le modèle le plus abouti).
Opus et Sonnet sont déjà disponibles sur Claude.ai et via l’API. La version Haiku devrait arriver dans les prochaines semaines. En plus de générer du texte et de répondre à des questions, ces trois versions peuvent être intégrées dans des chatbots de service client, écrire du code informatique ou encore faire de l’analyse de données.
Les versions précédentes de Claude avaient tendance à bouder certaines requêtes pourtant « inoffensives », en ce sens qu’elles ne violaient pas les conditions d’utilisation. Avec les nouveaux modèles, Anthropic promet des chatbots plus coopératifs, même avec les requêtes qui flirtent avec les limites des conditions d’utilisation sans les franchir. Cette « promesse » rappelle l’engagement de Meta qui prépare son modèle Llama 3.
Claude 3, supérieur à GPT-4, chiffres à l’appui
Anthropic assure que ses modèles Claude 3 fournissent des résultats quasi-instantanés, même lorsqu’ils décortiquent des documents complexes comme des articles scientifiques ou des rapports chiffrés.
Dans un article de blog, la jeune pousse affirme que Haiku, la version la plus légère de Claude 3, est « le modèle le plus rapide et le plus rentable sur le marché », capable de venir à bout d’un article de recherche dense, graphiques et tableaux inclus, « en moins de trois secondes ».
À lire également : Malgré la saga « Sam Altman », OpenAI boucle l’année avec un CA de 1,6 milliard de dollars
D’après Anthropic, Opus a surpassé la plupart des modèles du marché dans divers tests de benchmark. Il a montré un niveau de raisonnement digne d’un étudiant universitaire, supérieur donc à la capacité de raisonnement de GPT-4 d’OpenAI, avec un score de 50,4 % (vs. 35,7 % pour le produit d’OpenAI). Il s’est également montré plus performant dans la résolution de problèmes mathématiques, en codage et dans la compréhension de raisonnements complexes.