Retour sur l’OpenAI DevDay, la première conférence des développeurs d’OpenAI
La première conférence des développeurs d'OpenAI vient d'avoir lieu à SF, qui rassembler des développeurs du monde entier pour une journée de programmation afin de découvrir les dernières avancées en matière d'IA. 6 annonces ont été faites par Sam Altman dont la présentation GPT-4 Turbo.
Lors de l’événement OpenAI DevDay qui s’est tenu lundi, le PDG de l’entreprise, Sam Altman, a annoncé une mise à jour majeure de son modèle de langage GPT-4, baptisé GPT-4 Turbo. Cette version a la capacité de traiter une quantité beaucoup plus importante de texte que son prédécesseur, GPT-4, et elle intègre des connaissances actualisées jusqu’en avril 2023. De plus, Altman a présenté de nouvelles API pour DALL-E 3, GPT-4 Vision et text-to-speech. Il a également lancé une « Assistants API » qui permet aux développeurs de créer plus facilement des applications d’IA.
Nous savions que la plateforme était clairement le leader, ChatGPT se démarque en attirant 14 milliards de visites de septembre 2022 à août 2023, soit 60 % du trafic des 50 principaux outils d’IA. Sam Altamn a montré que son écosystème devient puissant avec plus de 2 millions de développeurs construisent des applications en utilisant ses API, plus de 92 % des entreprises Fortune 500 construisent sur leur plate-forme, et que ChatGPT compte plus de 100 millions d’utilisateurs hebdomadaires actifs.
OpenAI fait des choses impressionnantes. Ils se concentrent sur la voix, ce qui signifie que nous pourrons bientôt faire des choses sans toucher notre smartphone. C’est une grande avancée pour les développeurs et les utilisateurs. Leur communauté est incroyablement grande, ce qui les rend très puissants. C’est un avantage majeur pour leur croissance, et cela rappelle comment Microsoft a construit son propre écosystème prospère, mais n’avez pas réussi sur mobile. Lorsqu’une technologie est accessible à tous, des développeurs aux personnes âgées, c’est un énorme pas en avant en termes d’accessibilité. Cela dépasse même le début d’Internet, ce qui est incroyable. Cependant, OpenAI doit encore résoudre des problèmes complexes, comme la tarification de leurs services et leur impact sur l’environnement. Ce sont des défis importants à relever pour l’avenir.
Les caractéristiques phares de GPT-4 Turbo
- Capacité de traitement accrue : GPT-4 Turbo peut traiter une quantité beaucoup plus importante de texte que son prédécesseur, GPT-4. Cette amélioration permet de travailler avec des corpus de texte (Prompt) plus importants.Cela signifie que GPT-4 Turbo peut considérer environ 96 000 mots en une seule fois, ce qui est plus que de nombreux romans. En outre, une longueur de contexte de 128K peut conduire à des conversations beaucoup plus longues sans que l’assistant AI ne perde sa mémoire à court terme du sujet qui est à portée de main.
- Connaissances actualisées : GPT-4 Turbo dispose d’une coupure de connaissances d’avril 2023, ce qui signifie qu’il est capable d’incorporer des informations actualisées et récentes dans ses réponses et ses générations de texte.
- API pour DALL-E 3 : En plus de GPT-4 Turbo, OpenAI a également introduit des API pour DALL-E 3, un modèle d’IA qui génère des images à partir de descriptions textuelles. Cette API permet aux développeurs d’intégrer DALL-E 3 dans leurs applications et services.
- GPT-4 Vision : OpenAI a également dévoilé une API GPT-4 Vision, qui s’appuie sur GPT-4 pour effectuer des tâches de vision par ordinateur. Cette API peut être utilisée pour analyser et comprendre des images.
- Text-to-speech : OpenAI a présenté une API text-to-speech, qui permet de convertir du texte en discours vocal de manière naturelle et réaliste.
- Assistants API : Une autre nouveauté est l' »Assistants API, » qui facilite la création d’applications d’IA assistives. Cette API permet aux développeurs de tirer parti des modèles de langage d’OpenAI pour créer des systèmes d’assistance intelligents.
Créer des expériences de type agent
OpenAI a introduit l’API « Assistants », qui offre aux développeurs la possibilité de créer des « expériences d’assistant » au sein de leurs applications. Cette API est comparable à une version API du récent produit « GPT » d’OpenAI, offrant la personnalisation des instructions et la possibilité d’intégrer des outils externes. La clé de l’API Assistants est basée sur des threads persistants et infiniment longues qui permettent aux développeurs de renoncer à garder une trace d’un historique de conversation existant eux-mêmes et de gérer manuellement les limitations des fenêtres de contexte. Au lieu de cela, les développeurs peuvent ajouter chaque nouveau message à un thread existant. Contrairement à l’IA « stateless », qui signifie que le modèle d’IA aborde chaque session de chat comme une ardoise vierge sans connaissance des interactions précédentes, les gens appellent souvent cette approche « stateful ».
GPT, ces chatbots personnalisables
Construire son écosystème nécessite la simplicité c’est le cas des « GPT ». Ces chatbots personnalisables peuvent être adaptés pour donner une grande variété de tableaux personnels et professionnels, simples en parlant à un chatbot générateur de GPT en langage naturel sans aucun codage réquisition. Sam Altamn a montré en direct la création de l’un de ses GPT autour de l’aide à apporter aux fondateurs de startup. Ou chacun pourra poser des questions à ce chatbot qui reprendra les idées et pensées de Sam Altman tiré de documents, de conférence donné par le fondateur de OpenAI. Une fois qu’un GPT est présent, il peut être téléchargé sur le GPT Store d’OpenAI pour être utilisé par le public. La monétisation sera aussi au rendez-vous pour les développeurs pour les GPT les plus populaires. Les GPT peuvent être privés ou partagés publiquement avec un lien. Les entreprises pourront aussi créer des GPT pour les entreprises.
La voix est partout
Non seulement pour l’usage des utilisateurs notamment sur mobile, mais aussi pour les développeurs. OpenAI fournit maintenant une API de synthèse vocale, Audio API, qui offre six voix prédéfinies au choix et deux variantes génératives du modèle AI. Il est en direct à partir d’aujourd’hui, avec des prix à partir de $0.015 par entrée 1000 caractères. Cela débloque également de nombreux cas d’utilisation tels que l’apprentissage des langues et l’assistance vocale. Les développeurs peuvent maintenant générer un discours de qualité humaine à partir de texte via l’API text-to-speech.
Pour les développeurs qui ne maîtrisent peut-être pas la programmation, Sam Altman a annoncé que la société mettait en place un processus de développement GPT simplifié. « Nous sommes conscients que de nombreuses personnes qui souhaitent créer un GPT ne possèdent pas de compétences en programmation », a déclaré Sam Altman. « Nous avons rendu possible la programmation de GPT simplement en conversant avec lui. Nous pensons que le langage naturel jouera un rôle essentiel dans la manière dont les gens interagiront avec les ordinateurs à l’avenir. »