Gradium : l’IA vocale temps réel qui change la donne

Image d'illustration. Untitled upload from alphonseADN
Avec sa synthèse vocale expressive et instantanée, Gradium veut révolutionner notre manière d’interagir avec les machines. Une technologie de rupture déjà adoptée dans la santé, la traduction et le divertissement immersif.
Tl;dr
- Lancement de Gradium, moteur IA vocal ultra-réaliste.
- Levée de fonds de 70M$ pour accélérer l’innovation audio.
- Déjà adopté dans la santé, le jeu et la traduction.
Une révolution annoncée dans l’IA vocale
Derrière le lancement très attendu de Gradium, une équipe d’experts en intelligence artificielle ambitionne rien de moins que de redéfinir la relation entre humains et machines. Depuis seulement trois mois, cette jeune entreprise déploie déjà ses API de transcription et de synthèse vocale en streaming auprès d’acteurs variés : studios souhaitant créer des personnages immersifs, plateformes linguistiques désireuses d’offrir des traductions instantanées, ou encore innovateurs du secteur médical cherchant à développer des assistants conversationnels respectant des contraintes strictes de latence et de confidentialité.
Une technologie conçue pour la voix naturelle
Le pari fondateur repose sur une conviction simple mais exigeante : faire de la voix, ce moyen d’interaction humain par excellence – l’interface standard dans nos usages numériques. Pourtant, jusqu’ici, la plupart des solutions vocales restaient limitées par leur lenteur, leur coût ou leur manque de naturel. C’est précisément ce fossé que Gradium entend combler, s’appuyant sur plus d’une décennie de recherche pionnière. Sa plateforme propose aujourd’hui transcription multilingue (anglais, français, allemand, espagnol, portugais) et synthèse temps réel, avec une promesse : offrir un rendu vocal émotionnellement expressif tout en conservant rapidité et accessibilité.
Des racines scientifiques solides et un écosystème dynamique
L’équipe fondatrice réunit des profils chevronnés : on retrouve notamment Neil Zeghidour, Olivier Teboul, Laurent Mazaré et Alexandre Défossez, tous issus de laboratoires prestigieux comme Meta, Google DeepMind ou encore Google Brain. Leur parcours les a menés à inventer codecs neuronaux et modèles audio génératifs ; ils sont aussi à l’origine du premier modèle conversationnel temps réel dévoilé en 2024 via le laboratoire associatif Kyutai. Le lien demeure fort entre la recherche fondamentale et l’application industrielle : les avancées se traduisent rapidement en produits concrets chez Gradium.
Le projet a séduit nombre d’investisseurs majeurs lors d’un tour de table à hauteur de 70 millions de dollars, citons notamment FirstMark Capital, Eurazeo, ainsi que plusieurs personnalités influentes telles que Xavier Niel, Eric Schmidt, ou encore le scientifique renommé Yann LeCun. Cette confiance permet à Gradium d’accélérer son développement tout en consolidant son ambition mondiale.
L’avenir du dialogue homme-machine s’esquisse déjà
À l’horizon, la société vise rien moins que devenir le socle technique incontournable des interfaces vocales globales. Rendre les échanges avec des machines aussi naturels qu’une conversation humaine pourrait bientôt ne plus relever du fantasme technologique. Pour qui souhaite tester ces avancées ou rejoindre cette aventure avec des chercheurs aguerris ou développeurs passionnés promet une immersion immédiate au cœur du futur vocal.