Google Gemini évolue : une IA plus intuitive et interactive

Image d'illustration. Gemini 20ADN
Avec une meilleure compréhension linguistique, des capacités de traduction renforcées et l’arrivée du partage d’écran et du streaming vidéo, Google Gemini marque un tournant dans l’ère des agents AI.
Tl;dr
- Google améliore la compréhension linguistique de Gemini.
- Gemini intégrera le partage d’écran et le streaming vidéo.
- Google se concentre sur la nouvelle « ère des agents » AI.
Google Gemini : une mise à jour pour une meilleure compréhension linguistique
Google annonce une mise à jour importante de son outil de chat en direct, Google Gemini, qui lui permettra de mieux comprendre l’utilisateur, quel que soit son langage ou son accent. Une avancée majeure pour ce service qui n’avait jusqu’alors pas la capacité de comprendre efficacement les différentes langues, dialectes et accents lors d’un chat en direct.
En outre, Gemini ne se contentera pas seulement d’écouter mieux. Selon un courriel de l’équipe de Gemini, ses « capacités de traduction sont plus fortes que jamais ».
Nouveautés à venir : partage d’écran et streaming vidéo
Google prévoit également d’ajouter des fonctionnalités de partage d’écran et de streaming vidéo en direct à Gemini Live dans les mois à venir. Les données partagées via Gemini, y compris l’audio, la vidéo et les captures d’écran, seront stockées dans votre activité d’application Gemini, si cette option est activée. Cependant, il est important de noter que ces données seront supprimées lors de votre période d’auto-suppression, ou vous pouvez les supprimer vous-même en accédant aux paramètres.
L’ère des « agents » AI
Si ces mises à jour de Gemini Live sont significatives, elles ne constituent qu’une partie de la stratégie globale de Google. L’entreprise se concentre sur la nouvelle « ère des agents » AI. Les agents AI, bien que cela puisse sembler complexe, sont en fait la capacité d’un modèle AI à utiliser différentes sous-applications pour effectuer une gamme de petites tâches différentes simultanément.
Par exemple, Google a lancé un nouvel outil de recherche approfondie dans Gemini qui utilise ces agents pour naviguer sur le web à votre place, puis retourne un rapport basé sur ses découvertes. Cette approche diffère de l’utilisation du chatbot Gemini standard, où vous obtiendriez au mieux une liste de résultats de recherche pertinents. Nous attendons avec impatience de tester davantage les nouvelles fonctionnalités de Gemini Live. La voix étant devenue une caractéristique clé pour les entreprises d’IA, nous sommes impatients de voir comment cela se compare à des outils similaires comme le mode Voix avancé de ChatGPT.