DeepSeek face au mur des puces : l’obstacle technologique de la Chine

Image d'illustration. DeepSeekDeepSeek
Les entreprises chinoises d’IA peuvent-elles supporter le déploiement de DeepSeek ? Entre contraintes matérielles et retard face à Nvidia, le défi s’annonce de taille pour l’industrie des puces en Chine.
TL;DR
- Les entreprises chinoises d’IA adoptent DeepSeek, mais peinent à soutenir sa version complète.
- Les versions distillées de DeepSeek sont adéquatement prises en charge par les puces chinoises d’IA.
- Les entreprises chinoises d’IA sont à la traine par rapport à Nvidia sur certains points techniques.
Le défi des entreprises chinoises d’IA
Depuis quelque temps, un bourdonnement autour de l’adoption de DeepSeek par les entreprises chinoises occupe le devant de la scène. « Est-ce que les entreprises chinoises de puces d’IA peuvent soutenir le déploiement des modèles DeepSeek ? »Cette question, bien que pertinente, mérite une analyse approfondie.
Comprendre DeepSeek: version complète vs version distillée
DeepSeek propose deux versions principales de ses modèles. La première est une version distillée, un modèle de taille plus petite qui compte quelques milliards, voire des dizaines de milliards de paramètres. Cette version a l’avantage de réduire les coûts de déploiement. D’un autre côté, la version complète de DeepSeek monte haut avec un nombre de paramètres pouvant atteindre 671 milliards.
Ces deux versions présentent donc des enjeux différents pour l’industrie chinoise de l’IA. Si les puces d’IA chinoises ne rencontrent aucun problème pour soutenir la version distillée de DeepSeek, il en est autrement pour la version complète.
La bataille des puces chinoises pour soutenir la version complète de DeepSeek
Exécuter la version complète de DeepSeek requiert plus qu’un simple rack de serveur de 8 cartes, un défi pour les entreprises de puces chinoises. Jack, ingénieur senior en puces d’IA, souligne : « Il sera difficile de le faire, et il n’y a peut-être pas de fin en vue pour s’adapter avec succès à la version complète de DeepSeek. »
Nvidia vs les entreprises chinoises d’IA : un retard technologique ?
Nvidia, leader reconnu sur le marché, a une avance considérable dans cette compétition. Les puces d’IA chinoises ne prenant pas en charge les représentations de données FP8, cela implique que le déploiement de DeepSeek nécessite deux fois plus d’espace de stockage et de mémoire, augmentant le besoin de plus de cartes.
Bo Lin, vétéran de l’industrie des puces, est très franc sur le fait que les dernières puces d’IA chinoises ne prennent pas en charge le FP8 : « Cela montre que beaucoup de personnes qui fabriquent des puces d’IA en Chine ne comprennent pas l’IA. » Même si les entreprises chinoises établissent des records en matière de vitesse de traitement des données, ces progrès ne sont pas suffisants pour rivaliser avec Nvidia. Voilà sans doute encore un long voyage à entreprendre pour les firmes d’IA chinoises.