DeepSeek fait face à des pannes et des attaques malveillantes à grande échelle

Image d'illustration. DeepseekADN
DeepSeek, leader chinois de l'IA open-source, a connu des interruptions majeures sur ses services ce matin, évoquant des "attaques malveillantes". Retour sur une entreprise qui bouscule le secteur.
Tl;dr
- DeepSeek a connu des pannes affectant ses services API et de chat web.
- La start-up chinoise a temporairement limité les nouvelles inscriptions à des numéros de téléphone basés en Chine.
- DeepSeek se distingue par son engagement en faveur de l’open-source et son coût d’exploitation réduit.
Des perturbations notables
Le géant de l’IA, DeepSeek, a connu ce matin des interruptions de service sur ses API et services de chat web. Cette start-up chinoise, qui occupe actuellement la première place des applications gratuites de l’App Store d’Apple, a vu ses performances considérablement réduites, au grand dam de ses utilisateurs.
Un acteur majeur de l’IA
DeepSeek, fondée en 2023 et soutenue par le fonds spéculatif High-Flyer, s’est rapidement imposée comme une force majeure dans le paysage de l’IA. Sous la direction de Liang Wenfeng, cofondateur de High-Flyer, cette entreprise basée à Hangzhou, Zhejiang, se consacre à l’avancement de l’intelligence artificielle générale (IAG) par le biais de la recherche et du développement open-source. Elle a pour ambition de démocratiser la technologie de l’IA, la rendant accessible pour des applications commerciales et universitaires.
Des restrictions temporaires
En réponse à des « attaques malveillantes de grande envergure » visant ses services en ligne, DeepSeek a temporairement restreint les nouvelles inscriptions aux personnes possédant un numéro de téléphone basé en Chine. Les utilisateurs existants, quant à eux, ne sont pas affectés et peuvent continuer à accéder à leurs comptes sans interruption.
Un engagement envers l’open-source
Contrairement à de nombreuses entreprises d’IA qui proposent des modèles basés sur un abonnement, DeepSeek a pleinement adopté l’open-source. Ses modèles sont disponibles sous la licence MIT, permettant ainsi une utilisation commerciale et académique sans restriction. Cet engagement envers l’ouverture a grandement contribué à sa popularité croissante.
La société a introduit plusieurs modèles révolutionnaires, dont le DeepSeek-V3, qui compte 671 milliards de paramètres et a été formé sur un ensemble de données de 14,8 trillions de tokens en environ 55 jours, pour un coût d’environ 5,58 millions de dollars. Ce modèle surpasse des modèles tels que Llama 3.1 et Qwen 2.5 en termes de performances, tout en égalant les capacités de GPT-4o et Claude 3.5 Sonnet. Son architecture utilise un mélange d’experts avec un Transformateur d’Attention Latent à Multi-têtes, contenant 256 experts routés et un expert partagé, activant 37 milliards de paramètres par token.
En démontrant qu’il est possible de développer des modèles d’IA performants à des coûts et avec des ressources nettement inférieurs, DeepSeek a incité à une réévaluation des investissements massifs dans l’infrastructure de l’IA par les grandes entreprises technologiques.
En attente de plus de détails
L’entreprise n’a pas fourni de détails spécifiques sur la nature des attaques malveillantes ou la durée prévue des limitations d’inscription. Cette situation souligne les défis auxquels sont confrontées les plateformes d’IA en pleine croissance pour garantir la sécurité et la disponibilité des services face à l’augmentation des menaces cybernétiques.