Lors de l’événement OpenAI DevDay qui s’est tenu lundi, le PDG de l’entreprise, Sam Altman, a annoncé une mise à jour majeure de son modèle de langage GPT-4, baptisé GPT-4 Turbo. Cette version a la capacité de traiter une quantité beaucoup plus importante de texte que son prédécesseur, GPT-4, et elle intègre des connaissances actualisées jusqu’en avril 2023. De plus, Altman a présenté de nouvelles API pour DALL-E 3, GPT-4 Vision et text-to-speech. Il a également lancé une “Assistants API” qui permet aux développeurs de créer plus facilement des applications d’IA.
Nous savions que la plateforme était clairement le leader, ChatGPT se démarque en attirant 14 milliards de visites de septembre 2022 à août 2023, soit 60 % du trafic des 50 principaux outils d’IA. Sam Altamn a montré que son écosystème devient puissant avec plus de 2 millions de développeurs construisent des applications en utilisant ses API, plus de 92 % des entreprises Fortune 500 construisent sur leur plate-forme, et que ChatGPT compte plus de 100 millions d’utilisateurs hebdomadaires actifs.
OpenAI fait des choses impressionnantes. Ils se concentrent sur la voix, ce qui signifie que nous pourrons bientôt faire des choses sans toucher notre smartphone. C’est une grande avancée pour les développeurs et les utilisateurs. Leur communauté est incroyablement grande, ce qui les rend très puissants. C’est un avantage majeur pour leur croissance, et cela rappelle comment Microsoft a construit son propre écosystème prospère, mais n’avez pas réussi sur mobile. Lorsqu’une technologie est accessible à tous, des développeurs aux personnes âgées, c’est un énorme pas en avant en termes d’accessibilité. Cela dépasse même le début d’Internet, ce qui est incroyable. Cependant, OpenAI doit encore résoudre des problèmes complexes, comme la tarification de leurs services et leur impact sur l’environnement. Ce sont des défis importants à relever pour l’avenir.
OpenAI a introduit l’API “Assistants”, qui offre aux développeurs la possibilité de créer des “expériences d’assistant” au sein de leurs applications. Cette API est comparable à une version API du récent produit “GPT” d’OpenAI, offrant la personnalisation des instructions et la possibilité d’intégrer des outils externes. La clé de l’API Assistants est basée sur des threads persistants et infiniment longues qui permettent aux développeurs de renoncer à garder une trace d’un historique de conversation existant eux-mêmes et de gérer manuellement les limitations des fenêtres de contexte. Au lieu de cela, les développeurs peuvent ajouter chaque nouveau message à un thread existant. Contrairement à l’IA “stateless”, qui signifie que le modèle d’IA aborde chaque session de chat comme une ardoise vierge sans connaissance des interactions précédentes, les gens appellent souvent cette approche “stateful”.
Construire son écosystème nécessite la simplicité c’est le cas des “GPT”. Ces chatbots personnalisables peuvent être adaptés pour donner une grande variété de tableaux personnels et professionnels, simples en parlant à un chatbot générateur de GPT en langage naturel sans aucun codage réquisition. Sam Altamn a montré en direct la création de l’un de ses GPT autour de l’aide à apporter aux fondateurs de startup. Ou chacun pourra poser des questions à ce chatbot qui reprendra les idées et pensées de Sam Altman tiré de documents, de conférence donné par le fondateur de OpenAI. Une fois qu’un GPT est présent, il peut être téléchargé sur le GPT Store d’OpenAI pour être utilisé par le public. La monétisation sera aussi au rendez-vous pour les développeurs pour les GPT les plus populaires. Les GPT peuvent être privés ou partagés publiquement avec un lien. Les entreprises pourront aussi créer des GPT pour les entreprises.
Non seulement pour l’usage des utilisateurs notamment sur mobile, mais aussi pour les développeurs. OpenAI fournit maintenant une API de synthèse vocale, Audio API, qui offre six voix prédéfinies au choix et deux variantes génératives du modèle AI. Il est en direct à partir d’aujourd’hui, avec des prix à partir de $0.015 par entrée 1000 caractères. Cela débloque également de nombreux cas d’utilisation tels que l’apprentissage des langues et l’assistance vocale. Les développeurs peuvent maintenant générer un discours de qualité humaine à partir de texte via l’API text-to-speech.
Pour les développeurs qui ne maîtrisent peut-être pas la programmation, Sam Altman a annoncé que la société mettait en place un processus de développement GPT simplifié. “Nous sommes conscients que de nombreuses personnes qui souhaitent créer un GPT ne possèdent pas de compétences en programmation”, a déclaré Sam Altman. “Nous avons rendu possible la programmation de GPT simplement en conversant avec lui. Nous pensons que le langage naturel jouera un rôle essentiel dans la manière dont les gens interagiront avec les ordinateurs à l’avenir.”