ByteDance frappe fort avec OmniHuman-1, son IA aux vidéos plus vraies que nature

Image d'illustration. ByteDanceADN
Avec OmniHuman-1, ByteDance repousse les limites de l’IA multimodale, capable de générer des vidéos hyperréalistes de personnes parlant, chantant et se déplaçant avec une fluidité inédite.
TL;DR
- ByteDance a introduit un modèle AI inventif, OmniHuman-1.
- OmniHuman-1 produit des vidéos hyper réalistes à partir de photos et sons.
- Parfait exemple des progrès de la Chine dans le domaine de l’IA.
ByteDance présente son nouveau modèle d’IA
ByteDance, la firme technologique derrière TikTok, a fait une incursion remarquée dans le domaine des intelligences artificielles (IA) avec la démonstration de son dernier-né, OmniHuman-1. Cette avancée technologique, captivante de réalisme, a le pouvoir de donner vie à des images et des enregistrements sonores. Elle illustre bien le degré d’innovation que la Chine a atteint dans le secteur de l’IA.
OmniHuman-1 : un véritable prodige technologique
OmniHuman-1 est un modèle multimodal capable de générer des vidéos vivantes de personnes parlant, chantant et se déplaçant avec une qualité « nettement supérieure aux méthodes existantes de génération de vidéos humaines conditionnées par l’audio », selon les auteurs de ByteDance. Il est important de noter que « les images, vidéos et audios générés par l’IA de véritables personnes sont souvent qualifiés de deepfakes », une technologie utilisée tant dans des cas de fraude que pour des usages plus ludiques.
La montée de l’IA en Chine
ByteDance témoigne de l’engouement grandissant pour l’IA en Chine. Preuve en est, l’application Doubao de la firme est actuellement la plus populaire dans le secteur grand public. Toutefois, OmniHuman-1 n’est pas encore accessible au grand public, même si des extraits ont déjà suscité un grand intérêt en ligne.
Parmi ces démonstrations, un extrait de 23 secondes montre un réaliste Albert Einstein en train de donner un discours. Pour Kyle Wiggers de TechCrunch, le rendu est « sciemment bon » et « probablement l’un des deepfakes les plus réalistes à ce jour ».
Cette avancée significative dans l’IA met en évidence les progrès réalisés par les développeurs chinois, malgré les tentatives de Washington de freiner ces évolutions. Le lancement d’OmniHuman-1 fait suite à la mise à disposition de l’outil de génération vidéo Sora d’OpenAI pour les utilisateurs ChatGPT Plus et Pro en décembre dernier.