OpenAI confronte ChatGPT à des professionnels humains dans 44 métiers, découvrez la liste complète

Image d'illustration. ChatGPTOpenAI / PR-ADN
OpenAI soumet actuellement ChatGPT à des tests comparatifs avec des humains dans 44 professions variées, couvrant aussi bien le droit, le développement informatique que les soins infirmiers. Découvrez l’ensemble des métiers concernés par cette évaluation d’intelligence artificielle.
Tl;dr
- OpenAI teste GPT-5 face à des experts humains.
- 1 320 tâches réelles couvrant 44 métiers sont utilisées.
- L’IA approche la qualité professionnelle, mais reste perfectible.
Un nouveau défi pour l’intelligence artificielle
La société OpenAI, connue pour avoir développé ChatGPT, lance une nouvelle phase de tests pour sa dernière version du modèle, baptisée GPT-5.
Cette fois-ci, l’enjeu va bien au-delà des simples quiz académiques ou des compétitions de code : l’intelligence artificielle doit désormais se confronter directement à des experts humains dans une variété impressionnante de métiers.
Le benchmark GDPval : une immersion dans le travail réel
Pour mener cette évaluation, OpenAI s’appuie sur un outil inédit : le benchmark GDPval. Exit les questions théoriques et génériques ; ici, chaque tâche est conçue à partir de véritables productions professionnelles, qu’il s’agisse d’un plan de soins infirmiers, d’un rapport financier, d’un dossier juridique ou encore d’une conversation avec un client.
Au total, ce sont 1 320 missions spécialisées — dont une sélection « gold » ouverte en open source — imaginées puis vérifiées par des spécialistes ayant en moyenne plus de 14 ans d’expérience dans leur domaine.
Ce panel couvre pas moins de 44 métiers répartis sur neuf secteurs différents. Parmi eux :
- Infirmiers, ingénieurs, journalistes, développeurs logiciels ou encore directeurs financiers.
Cette diversité vise à mesurer si l’IA peut s’approcher du niveau attendu dans des contextes authentiques et complexes.
Où se situe GPT-5 face aux humains ?
Selon OpenAI, les performances atteintes par GPT-5 — tout comme celles du concurrent Claude Opus 4.1 d’Anthropic — « s’approchent déjà de la qualité du travail produit par les experts du secteur ».
Toutefois, la société nuance : si ces résultats sont prometteurs pour l’avancée vers l’AGI (intelligence artificielle générale), ils ne reflètent qu’un début. Les tests actuels restent ponctuels (« one-shot »), sans laisser à la machine le temps de construire du contexte ou d’affiner ses réponses sur plusieurs versions successives.
L’avenir du travail redéfini mais pas effacé
Reste alors la question que tout le monde se pose : cette avancée signifie-t-elle que les métiers disparaîtront au profit de l’IA ? Il serait prématuré de trancher. Bien que la transformation du paysage professionnel paraisse inévitable, l’intégration effective de ces outils dépendra largement des choix opérés par les entreprises et la société civile.
Comme le souligne la communication d’OpenAI, certains aspects humains demeurent hors de portée actuelle des algorithmes. À terme, il ne fait guère de doute que la nature même du travail évoluera… mais sans pour autant reléguer totalement l’humain au second plan.