Google présente Gemini, son nouveau modèle d’intelligence artificielle concurrent de ChatGPT

7 décembre 2024

Google vient de dévoiler son nouveau modèle d’IA, appelé Gemini, qui entend surpasser son rival ChatGPT, de la firme OpenAI, dans la génération de texte, d’images, de son ou de vidéos. Entre autres.

La bataille de l’IA ne fait que commencer. Alors que Google était régulièrement accusé d’avoir pris du retard dans l’intelligence artificielle générative, notamment face à ChatGPT d’OpenAI et son partenaire Microsoft, la firme de Mountain View vient de faire une annonce qui risque de rabattre les cartes : la présentation de Gemini.

Notre modèle d’IA le plus conséquent, le plus doué et aussi le plus général », revendique Eli Collins, vice-président de Google DeepMind, le laboratoire de recherche en IA du groupe.

Dans une présentation à la presse, Google a fait état des potentialités de Gemini. Une vidéo est particulièrement éclairante : elle montre un utilisateur qui montre des objets ou des dessins à l’IA. Cette dernière commente à l’oral ce qu’elle « voit » et en déduit des caractéristiques (comme par exemple la matière en plastique d’un petit canard bleu). De quoi continuer à alimenter le fantasme d’une « super IA » générale capable de penser comme une vraie personne.

Une amélioration de Bard

En juillet, l’entreprise californienne avait déjà présenté son propre robot conversationnel, dénommé Bard. Gemini ne vise pas à le remplacer mais au contraire à l’améliorer, grâce à un modèle de fondation plus récent. Dans son communiqué, Google affirme avoir conçu le premier « vrai modèle multimodal » au monde. C’est-à-dire capable d’intégrer autant du texte, du son ou des images à sa « réflexion ».

Gemini est disponible dès ce mercredi, seulement en anglais dans un premier temps. Il sera intégré progressivement aux derniers téléphones Pixel, puis, dans les prochains mois, aux autres services phares de Google comme son moteur de recherche, son navigateur Chrome ou son service de publicité Google Ads.

La firme de Mountain View revendique d’ailleurs surpasser GPT-4 dans 30 des 32 référentiels académiques utilisés dans la recherche et le développement des LLM. En tout cas pour sa version maximale, intitulée Gemini Ultra. Mais Gémini se déclinera aussi avec une version « pro » (celle qui sera intégrée aux services de Google) et une version allégée « Nano » qui pourra être utilisée localement, sans recourir à des serveurs externes, par exemple depuis un téléphone.

OpenAI, malgré ses enjeux de gouvernance récent, avec le licenciement puis le retour de son dirigeant Sam Altman, ne compte évidemment pas se laisser rattraper aussi facilement, elle qui s’est fait connaître mondialement il y a à peine plus d’un an avec son désormais célèbre ChatGPT. Dans un entretien récent au Financial Times, son président fondateur indiquait déjà travaillé sur sa nouvelle version, GPT-5. Sans calendrier annoncé.

Tant que nous n’aurons pas mis en place ce modèle, c’est un jeu de devinettes amusant pour nous », a indiqué Sam Altman. « Nous essayons de nous améliorer, car je pense qu’il est important, du point de vue de la sécurité, de prévoir les capacités. Mais je ne peux pas vous dire exactement ce qu’il va faire et que le GPT-4 n’a pas fait. »

Découvrez nos formations :