ChatGPT s’apprête à intégrer une caméra en direct

Image d'illustration. Chat GPTADN
Bientôt, vous pourrez découvrir la fonctionnalité de la caméra en direct sur ChatGPT. Voici tout ce que nous savons à propos de cette nouveauté très attendue.
Tl;dr
- OpenAI prépare le déploiement de son IA visuelle.
- La fonctionnalité ‘Live Camera’ serait intégrée à ChatGPT.
- On attend des nouvelles sur l’avancement du projet.
OpenAI : la technologie de reconnaissance visuelle en phase de test
Six mois se sont écoulés depuis la démonstration initiale de l’IA visuelle d’OpenAI. Celle-ci est capable d’identifier à peu près tout, y compris de résoudre des équations mathématiques. Aujourd’hui, nous nous rapprochons enfin de la possibilité d’une mise en service.
ChatGPT se dote de nouvelles fonctionnalités
Des références à des fonctionnalités vidéo ‘Live Camera’ ont été repérées dans le code de la dernière version bêta de ChatGPT. Ce qui signifie que l’application OpenAI pourrait ajouter des ‘yeux’ à son mode vocal avancé déjà très impressionnant. Les informations trouvées dans le code de la version 1.2024.317 révèlent des fonctionnalités telles que « la fonctionnalité de la caméra en direct », « le traitement en temps réel », « l’intégration du mode vocal » et « les capacités de reconnaissance visuelle ».
De nouvelles perspectives avec la ‘Live Camera’
Cela pourrait vous permettre d’ouvrir la webcam pendant que vous parlez en mode vocal avancé, afin qu’il puisse donner un retour en direct sur ce qu’il peut voir devant vous. C’est similaire au Project Astra de Google avec une analyse visuelle en temps réel. Les caractéristiques trouvées dans la version bêta de l’application ChatGPT Android suggèrent que la fonctionnalité Live Camera pourrait arriver dans une version bêta de ChatGPT dans un futur proche.
Des démonstrations prometteuses
Durant les démonstrations de mai lors de la mise à jour de printemps d’OpenAI, les fonctionnalités vidéo pouvaient reconnaître un chien, ses actions avec une balle et plus encore, tout en se souvenant des informations clés comme le nom du chien. Une autre démonstration a montré quelqu’un utilisant la fonctionnalité ‘Live Camera’ de ChatGPT lors d’une visite de Londres, pour lui permettre de pointer des détails sur différents lieux et points de repère.
Alors que le déploiement de la voix avancée est désormais accessible à tous, y compris sur le web, les choses ont été calmes concernant la fonctionnalité ‘Live Camera’ depuis l’annonce. Mais nous restons optimistes et avons hâte de voir les prochains développements de cette technologie prometteuse.