Le pari était affiché depuis des mois : faire oublier les débuts chaotiques de Gemini et revenir au premier plan face à OpenAI, Anthropic ou xAI. Google a choisi ce 18 novembre 2025 pour dévoiler Gemini 3, présenté comme son modèle d’intelligence artificielle « le plus intelligent » à ce jour. Au-delà du slogan, le groupe met en avant une avalanche de chiffres, une nouvelle plateforme de développement et un virage assumé vers des agents capables d’agir quasiment seuls sur un ordinateur.
Pour les passionnés de sciences, de jeux vidéo et de technologies, cette annonce n’est pas un simple changement de numéro de version. Elle dit beaucoup de la façon dont l’IA va s’installer au cœur de nos usages quotidiens, de nos outils de travail et, demain, dans nos loisirs les plus geeks.
Deux ans après le lancement de Gemini, un virage à haute vitesse
Gemini n’a que deux ans d’existence, mais Google parle déjà d’« ère » tant les investissements ont été massifs. Sundar Pichai rappelle que les surcouches d’IA dans la recherche servent désormais chaque mois des milliards d’utilisateurs, que l’application Gemini dépasse les centaines de millions d’usagers actifs et que des millions de développeurs s’appuient sur les modèles maison pour créer des services.
Gemini 3 arrive surtout dans un contexte de concurrence féroce. OpenAI a dégainé de nouveaux modèles de la série GPT 5, Anthropic pousse sa gamme Claude Sonnet, xAI multiplie les annonces autour de Grok et chaque acteur revendique être en tête sur tel ou tel test académique. Plusieurs médias spécialisés résument la situation en une formule simple : pour Google, Gemini 3 est la réponse directe aux dernières générations de modèles concurrents.
Pour ne pas rester à la traîne, Google ne se contente pas d’un simple rafraîchissement. Gemini 3 est introduit en même temps dans la recherche, dans l’application dédiée, dans les outils pour développeurs et dans l’offre entreprise. Le message est clair : il ne s’agit plus d’une expérimentation, mais d’une brique centrale de l’écosystème Google.
Des scores record sur les benchmarks de l’IA
Derrière les discours, il y a les chiffres. Et Google ne se prive pas de les mettre en avant. Selon la fiche technique publiée par DeepMind, Gemini 3 Pro, la première déclinaison rendue publique, se place tout en haut de plusieurs classements.
Parmi les indicateurs mis en avant :
- un score Elo de 1501 sur un benchmark communautaire, qui place Gemini 3 Pro au sommet des modèles testés ;
- plus de 90 % de réussite sur un benchmark scientifique avancé, censé représenter des connaissances de niveau recherche ;
- un nouveau record sur un benchmark de mathématiques complexes ;
- un score de plus de 70 % sur un test mesurant la capacité du modèle à fournir des réponses factuellement correctes.
Sur les tests multimodaux, qui mélangent texte, image et vidéo, Gemini 3 Pro dépasse les 80 % sur plusieurs évaluations visuelles complexes, frôlant les 88 % sur un benchmark vidéo.
Pour la communauté scientifique comme pour le monde du jeu vidéo, cette capacité à raisonner à partir de médias variés est cruciale : comprendre une expérience de physique filmée, analyser un niveau de jeu capturé en vidéo ou décrypter un schéma devient théoriquement accessible à l’IA.
Deep Think, le mode « cerveau turbo »
La grande nouveauté de Gemini 3 ne se limite pas à la version Pro. Google introduit un mode spécifique baptisé Deep Think, présenté comme une configuration de raisonnement intensif. Lorsque l’utilisateur l’active, le modèle prend davantage de temps, multiplie les étapes de réflexion et pousse plus loin l’analyse.
Deep Think améliore encore les résultats sur les tests les plus exigeants. Sur un benchmark regroupant des questions très difficiles, le score de Gemini 3 passe d’environ 37,5 % à 41 % sans recours à des outils externes. Sur un autre benchmark scientifique avancé, le modèle grimpe à près de 94 %. Sur un test de puzzles abstraits destinés à approcher les capacités de raisonnement général, Deep Think atteint plus de 45 % avec exécution de code, un niveau inédit.
Pour l’instant, ce mode est réservé aux équipes de test et aux spécialistes de la sécurité. Google prévoit de l’ouvrir ensuite aux abonnés de son offre la plus avancée.
De l’IA bavarde à l’IA « agent »
Depuis un an, tous les grands acteurs de l’IA parlent d’« agents », ces systèmes capables non seulement de répondre à des questions, mais aussi d’agir sur un ordinateur : ouvrir un onglet, modifier un fichier, lancer une commande, réserver un service. Avec Gemini 3, Google entend clairement se positionner dans cette course.
La nouveauté la plus spectaculaire s’appelle Google Antigravity. Derrière ce nom se cache une plateforme qui rassemble un éditeur de code, un terminal et un navigateur, tous accessibles aux agents pilotés par Gemini 3. Le modèle peut y planifier, générer et tester un projet logiciel complet en exécutant lui-même les commandes nécessaires et en vérifiant les résultats.
Antigravity peut s’appuyer sur un modèle Google spécialisé dans le contrôle du navigateur, ainsi que sur un modèle dédié au traitement d’images. Ces briques permettent aux agents de cliquer, naviguer, modifier et valider de manière autonome.
Dans la communication de Google, l’IA n’est plus un simple outil. Elle devient un partenaire capable de travailler en parallèle, de rédiger du code, de corriger ses propres erreurs et de mener plusieurs tâches simultanément. Pour les créateurs de jeux indépendants ou les développeurs web, cela pourrait transformer la façon de prototyper un niveau, une interface ou un système de quêtes.
Derrière Siri, c’est Gemini de Google qui bosse (et Apple qui encaisse)
Trois grandes promesses : apprendre, construire, planifier
Apprendre avec une IA vraiment multimodale
Gemini 3 peut traiter de longs contextes, jusqu’à un million de jetons, c’est-à-dire l’équivalent de plusieurs articles scientifiques, d’un chapitre complet de manuel, d’une vidéo de cours et de notes manuscrites, tout cela dans une seule demande.
Exemples mis en avant :
- transformer des recettes familiales manuscrites en livre de cuisine structuré ;
- synthétiser des heures de cours filmés en fiches interactives ;
- analyser une vidéo de match pour proposer un programme d’entraînement personnalisé.
Dans la recherche Google, un mode IA dédié propose désormais des mises en page génératives avec animations, schémas ou simulations interactives selon la requête.
Construire plus vite des applications et des jeux
Gemini 3 peut produire une application web complète à partir d’un simple prompt. Sur un benchmark d’interface web, il arrive en tête. Sur des tests simulant l’utilisation du terminal comme un développeur, le modèle affiche plus de 50 %. Sur des tests axés sur les tickets open source, il dépasse les 75 %.
Pour les créateurs de jeux :
- génération automatique d’un prototype de shoot spatial en 3D ;
- création ou remix de scènes en voxels ;
- production d’environnements avec shaders avancés.
Gemini 3 est accessible via plusieurs outils de développement, qu’ils soient internes à Google ou intégrés dans des IDE tiers.
Planifier et agir sur la durée
Gemini 3 se montre plus fiable pour planifier sur le long terme. Des tests simulant la gestion d’un parc de distributeurs automatiques montrent qu’il maintient une stratégie stable sur une année virtuelle entière.
Google met également en avant un Gemini Agent capable d’organiser une boîte mail, coordonner des rendez-vous ou exécuter plusieurs tâches en chaîne.
Plus d’infos sur le Blog Google
