AGI, MCP, tokens, MoE, hallucinations: le vocabulaire de l’IA devient un vrai signal business. Derrière les sigles, on lit déjà les priorités du secteur.
En bref
- Le lexique IA devient un signal marché
- Les agents déplacent la valeur vers l’exécution
- L’infra reste le vrai point de tension
Le plus intéressant, dans ce grand lexique de l’IA, n’est pas la pédagogie. C’est ce qu’il raconte du marché. Quand un secteur commence à fixer ses mots, il commence aussi à fixer ses priorités, ses coûts et ses promesses.
Le jargon produit montre où l’IA sort du chatbot
Le bloc le plus parlant tourne autour des LLM, des agents et des connexions aux services tiers. Un LLM reste le moteur de base des assistants comme ceux d’OpenAI, Google, Meta, Microsoft, Mistral ou Anthropic. Mais la valeur se déplace quand ce moteur peut raisonner par étapes, avec la chain of thought, puis agir via des API endpoints, ces points d’accès logiciels que les agents peuvent appeler pour réserver, exécuter, récupérer ou modifier.
C’est là qu’arrivent le MCP, standard lancé par Anthropic puis confié à la Linux Foundation, et les coding agents, capables d’écrire, tester et corriger du code avec peu de supervision. Le signal est clair: l’enjeu n’est plus seulement de répondre, mais d’enchaîner des actions fiables.
L’infrastructure redevient centrale
Derrière les démonstrations produit, on retombe vite sur le concret. Le compute, donc les GPU, CPU, TPU et autres accélérateurs. L’inference, autrement dit l’exécution du modèle une fois entraîné. Et le memory cache, notamment le KV caching, qui réduit les calculs inutiles pour accélérer les réponses.
Même chose pour les tokens et le token throughput. Les premiers servent d’unité de langage et souvent d’unité de facturation. Le second mesure combien de texte un système peut traiter sur une période donnée, donc combien d’utilisateurs il peut servir vite et bien. La parallelization pousse la même logique à l’échelle des puces et des machines. Résultat, la pression sur la mémoire explose, au point de faire émerger le terme RAMageddon, signe d’une pénurie de RAM qui renchérit consoles, smartphones et data centers.
Les modèles gagnent en spécialisation, pas seulement en taille
Le lexique insiste aussi sur la fabrication des modèles. Le training apprend des motifs à partir des données, puis le fine-tuning affine un modèle sur un métier ou une tâche. Le transfer learning réutilise une base existante. La distillation compresse le savoir d’un gros modèle vers un plus petit, plus rapide et moins coûteux.
Sous le capot, on retrouve neural networks, deep learning, weights et validation loss. Et côté architecture, le MoE active seulement quelques experts à la fois, ce qui permet d’agrandir sans tout faire tourner en permanence. C’est propre, techniquement.
Le débat de fond reste ouvert
Quelques termes résument à eux seuls les tensions du secteur. L’AGI n’a toujours pas de définition stable, entre Sam Altman, OpenAI et Google DeepMind. La recursive self-improvement prolonge cette idée avec des modèles capables d’améliorer eux-mêmes leur successeur.
En face, les limites restent très concrètes: hallucinations, donc informations inventées, et bataille entre open source et systèmes fermés. Même les briques génératives comme la diffusion ou les GAN rappellent la même chose: l’IA avance vite, oui, mais elle avance surtout là où produit, coût et contrôle finissent par s’aligner.