IA vocale : Google DeepMind s’empare des talents de Hume AI

Image d'illustration. Interface vocale futuriste interagissant avec un humainInteraction entre l'interface vocale futuriste et l'humain, illustrée par des ondes sonores colorées représentant les émotions dans une atmosphère technologique dynamique.
Google DeepMind recrute les têtes pensantes de Hume AI pour renforcer Gemini. Objectif : rendre l’IA plus humaine, dans une bataille mondiale où la voix devient le nouvel enjeu stratégique.
Tl;dr
- Google DeepMind recrute l’équipe dirigeante de Hume AI.
- L’intégration vise à renforcer Gemini en voix et émotion.
- La concurrence investit massivement dans l’IA vocale.
Une vague de rachats stratégiques agite l’IA vocale
Les grandes manœuvres se poursuivent dans le secteur de l’intelligence artificielle vocale. Cette semaine, c’est au tour de Google DeepMind d’attirer sous sa bannière une partie des cerveaux de la jeune pousse Hume AI, spécialisée dans la compréhension des émotions à partir de la voix. Selon le média américain Wired, le PDG Alan Cowen ainsi qu’une poignée d’ingénieurs rejoindront les équipes du groupe pour muscler les fonctionnalités vocales du modèle maison, Gemini. Une information que plusieurs sources du secteur ont confirmée.
Partenariats et acquisitions : une course effrénée aux talents
Plutôt que de racheter les startups dans leur intégralité, les géants du secteur adoptent désormais une stratégie plus discrète : s’offrir les talents clés à travers des accords de licence ou d’intégration partielle. C’est exactement ce qui s’est produit avec Hume AI. Le reste de la société continuera à proposer ses technologies à d’autres acteurs, tout en conservant son indépendance. Pour Andrew Ettinger, nouveau CEO arrivé tout récemment, il s’agit simplement pour Google d’un « droit non exclusif sur certaines technologies, que nous allons intégrer à leurs processus ». Il promet par ailleurs de nouveaux modèles prochainement et vise un chiffre d’affaires ambitieux, avoisinant les 100 millions de dollars cette année.
Cette tendance n’est pas isolée. L’an passé déjà, Google avait recruté l’équipe dirigeante de la startup virale Windsurf. De son côté, OpenAI a mis la main sur plusieurs équipes émergentes comme Convogo et Roi. Face à cette accélération des « acqui-hires », la Federal Trade Commission (FTC) a annoncé vouloir scruter ces opérations qui échappent souvent au radar des autorités.
L’émotion vocale : nouvel eldorado technologique ?
Ce regain d’intérêt s’explique par une évolution rapide des usages autour de la voix. Le modèle développé par Hume AI, levé à hauteur de près de 80 millions selon PitchBook, se distingue grâce à sa capacité à décoder les émotions et l’humeur des utilisateurs lors des échanges vocaux. En début d’année, la startup avait dévoilé son Empathetic Voice Interface, positionnée comme une IA conversationnelle dotée d’intelligence émotionnelle.
À la même période, Google déployait une nouvelle version audio native pour son API Live améliorant nettement la gestion des interactions complexes avec Gemini Live.
Un marché en pleine ébullition et une concurrence féroce
Difficile cependant pour Google d’avancer sans surveiller ses rivaux. Chez OpenAI, on préparerait activement une refonte des modèles audio en vue du lancement d’un appareil personnel axé sur le son conçu en partenariat avec io et Jonny Ive dont quelques fuites évoquent le format écouteurs. Meta n’est pas en reste : après avoir acquis Play AI l’an passé, le groupe mise sur ses lunettes Ray-Ban connectées, truffées de fonctions vocales facilitant appels ou prises de photos mains libres.
Pour illustrer cette dynamique galopante :
- L’investisseur Vanessa Larco estime que « la voix est désormais incontournable sur les objets connectés portables ».
- L’entreprise ElevenLabs revendique désormais plus de 330 millions en revenus récurrents annuels grâce à la génération vocale IA.
Sans surprise donc : renforcer sa maîtrise de la voix est devenu un passage obligé pour rester dans la course mondiale à l’innovation.