Avec Jalapeño, OpenAI et Broadcom passent du logiciel au silicium. Un virage stratégique pour mieux maîtriser l’inférence des LLM.
En bref
- OpenAI dévoile sa première puce IA
- Broadcom l’a co-développée en neuf mois
- Déploiement initial prévu fin 2026
OpenAI ne veut plus seulement écrire les modèles, il veut aussi peser sur la machine qui les fait tourner. Avec Jalapeño, conçu avec Broadcom, l’entreprise entre pour la première fois dans le monde des puces IA, un terrain où se jouent à la fois les coûts, la vitesse d’exécution et la capacité à faire monter l’inférence à grande échelle.
Pourquoi OpenAI ne veut plus dépendre seulement des autres
Le point important, c’est la logique industrielle derrière l’annonce. En maîtrisant davantage de briques dans la chaîne qui fait tourner ses modèles, OpenAI explique vouloir rendre son activité plus efficace et augmenter la manière dont les utilisateurs pourront exploiter les outils ChatGPT. En gros, moins de dépendance, plus de contrôle, et potentiellement une meilleure adéquation entre le logiciel et le silicium.
Ce n’est pas anodin. Jusqu’ici, OpenAI s’appuyait sur des composants conçus par d’autres pour entraîner et faire fonctionner ses modèles.
Un accélérateur pensé pour l’inférence, pas pour tout faire
OpenAI présente Jalapeño comme son premier processeur d’intelligence, un accélérateur conçu autour de sa vision de l’avenir de l’inférence des LLM. Autrement dit, la puce n’est pas présentée comme un composant universel, mais comme un outil ciblé pour exécuter les grands modèles de langage.
L’entreprise affirme déjà obtenir avec Jalapeño une performance par watt nettement supérieure à l’état de l’art actuel. Mais elle nuance elle-même ce point, les tests finaux étant encore en cours. Un rapport technique plus complet sur les performances doit arriver dans les prochains mois. Pas de quoi surinterpréter trop vite, donc, même si la promesse est solide sur le papier.
Neuf mois de conception et un calendrier déjà fixé
L’autre signal fort, c’est la vitesse. OpenAI indique que Jalapeño a été co-développé entre le design initial et le tape-out de fabrication en seulement neuf mois. C’est rapide, clairement, et la société l’explique par un travail étroit entre ses équipes d’ingénierie et l’expertise silicium de Broadcom.
Elle ajoute aussi avoir utilisé ses propres modèles pour accélérer une partie du design et de l’optimisation. Voilà le contraste intéressant, une IA qui aide à concevoir l’infrastructure matérielle de l’IA.
La prochaine étape est déjà posée. Les premiers déploiements dans des data centers doivent commencer fin 2026.
Une alliance pensée sur plusieurs générations
Jalapeño n’est pas un coup isolé. OpenAI et Broadcom avaient annoncé en octobre 2025 leur intention de collaborer sur un accélérateur IA sur mesure. Ce premier composant ouvre, selon les deux groupes, une plateforme de calcul pensée sur plusieurs générations.
L’ambition affichée est simple, même si elle est vaste, rendre l’IA avancée plus rapide, plus fiable et plus accessible. Pour l’écosystème, c’est surtout un signe de plus, les grands acteurs de l’IA ne veulent plus seulement entraîner des modèles. Ils veulent aussi choisir, et désormais fabriquer, la base matérielle qui les fera tourner.