Gemini dévoile une mise à jour majeure : découvrez toutes les nouvelles fonctionnalités de son IA

Image d'illustration. GeminiADN
La dernière mise à jour du modèle d’intelligence artificielle Gemini apporte de nombreuses améliorations. De nouvelles fonctionnalités sont désormais accessibles, permettant aux utilisateurs de profiter d’outils plus performants et d’interactions enrichies avec cette technologie avancée.
Tl;dr
- Gemini bénéficie de mises à jour majeures et de nouvelles fonctions.
- La sécurité, la performance et l’IA conversationnelle sont renforcées.
- Des outils avancés ciblent développeurs et usages professionnels.
Gemini : un tournant pour l’intelligence artificielle chez Google
La conférence annuelle I/O de Google a marqué une étape clé pour sa famille d’IA : la plateforme Gemini profite d’un ensemble de mises à jour structurantes, parfois attendues, parfois plus surprenantes. Si la firme n’a pas lésiné sur les annonces autour de l’écosystème IA dans son ensemble – du générateur vidéo Veo 3 aux nouveaux plans tarifaires –, c’est surtout la refonte profonde de Gemini qui retient l’attention.
Désormais, plusieurs versions de ce modèle évoluent. Côté développeurs notamment, des innovations comme les « Thought Summaries », budgets de réflexion (« thinking budgets ») ou encore le support MCP visent à rendre l’usage plus transparent et mieux maîtrisé. Pour ceux qui exploitent l’API, la possibilité d’obtenir des synthèses structurées des raisonnements du modèle ou de réguler le volume d’utilisation grâce aux tokens promet un contrôle inédit sur coût et qualité.
Nouveaux modes : du raisonnement poussé à l’audio natif
Parmi les nouveautés majeures, le mode Deep Think, encore en phase de test, intrigue particulièrement. Il s’agit d’un système avancé de raisonnement, capable de confronter différentes hypothèses avant de répondre – une petite révolution dans la manière dont une IA peut aborder des problèmes complexes. Les premiers résultats évoqués par Google montrent que ce mode excelle déjà sur certains benchmarks mathématiques réputés difficiles.
En parallèle, Gemini gagne une dimension supplémentaire avec l’arrivée prochaine d’une sortie audio native : les utilisateurs pourront personnaliser voix, accent et expressivité. Des outils comme le dialogue affectif – où la machine réagit selon les émotions détectées – ou le filtrage intelligent des conversations ambiantes doivent renforcer la sensation d’échanges naturels.
Efficacité accrue et sécurité renforcée
L’optimisation reste au cœur des priorités. Ainsi, l’évolution « 2.5 Flash » destinée aux tâches simples permet désormais des performances supérieures tout en consommant 20 à 30 % moins de ressources informatiques. Quant au modèle « 2.5 Pro », il se distingue désormais dans la génération d’applications web interactives et caracole en tête des classements spécialisés comme WebDev Arena ou LMArena.
Enfin, impossible d’ignorer le renforcement des dispositifs de sécurité sur toute la gamme Gemini. Selon Google, cette génération serait la plus robuste jamais conçue contre les tentatives malveillantes.
L’expérimentation au service de l’innovation continue
Sur un ton presque prudent, Google prend soin d’annoncer que certaines fonctionnalités — citons par exemple le projet expérimental Mariner, capable d’exécuter automatiquement des tâches sur différents sites web — seront réservées dans un premier temps aux seuls développeurs partenaires via Vertex AI ou l’API Gemini.
Autrement dit, si Gemini poursuit sa métamorphose sous nos yeux, il faudra attendre encore un peu pour que le grand public mesure pleinement tout le potentiel (et les limites) des dernières avancées dévoilées par la firme californienne.