Nous le savions depuis longtemps, nous avons dans les mains une puissance incroyable de calcul. L’iPhone dans votre poche a plus de 100 000 fois la puissance de traitement de l’ordinateur qui a fait atterrir l’homme sur la lune il y a 50 ans. Lors du MWC 2023, Qualcomm a rappelé que l’IA doit fonctionner sous des limitations de puissance à la périphérie (edge), pas seulement dans un centre de données bourré de GPU. Être plus proche offre des avantages, notamment en réduisant considérablement la latence de bout en bout, en diminuant la charge et en économisant les coûts sur le réseau de transport de liaison et en améliorant la confidentialité des données.
À mesure que les smartphones deviennent de plus en plus performants, de plus en plus de charges de travail se déplacent sur l’appareil et hors du cloud. Stable Diffusion qui est un modèle d’IA générative de texte à image capable de créer des images photoréalistes à partir de n’importe quelle entrée de texte. Maintenant, pour la première fois, avec plus d’un milliard de paramètres, Stable Diffusion se limitait jusqu’à présent à fonctionner dans le cloud. Pour la toute première fois, Qualcomm a rendu possible l’exécution du modèle sur un smartphone Android plus rapide et plus économe en énergie avec le Snapdragon 8 Gen 3.
Sur les smartphones c’est très prometteur, avec des implications majeures pour la technologie et la société. Ces logiciels jouent un rôle central dans de nombreuses applications, de la navigation GPS à la géolocalisation des médias sociaux. À mesure que les smartphones deviennent plus puissants, ces applications évoluent pour offrir des fonctionnalités de localisation plus avancées. D’ailleurs Meta et Qualcomm ont annoncé que Meta’s Llama 2-based AI qui devrait être disponible sur les chipsets Snapdragon à partir de 2024. Llama 2 est une version open-source d’un AI LLM développé par Meta. Ces nouvelles expériences d’IA sur l’appareil peuvent fonctionner dans des zones sans connectivité ou même en mode avion.
Le modèle Llama 2 de Meta présente un avantage par rapport à son rival GPT-4 : Llama 2 peut être intégré dans un programme plus petit, ce qui signifie qu’il peut fonctionner sur des appareils petits et plus légers, c’est-à-dire les smartphones et permettra de diviser le poids des données entre le cloud et l’appareil. L’IA sur l’appareil permettra d’activer aussi des applications telles que les assistants virtuels intelligents, ce qui rendra la vie des consommateurs encore plus facile que les assistants vocaux actuels.
L’une des tendances futures les plus marquantes est l’amélioration de la précision de la localisation. Grâce à des technologies telles que le GPS, GLONASS, Galileo et Beidou, les smartphones deviennent plus précis pour déterminer la position de l’utilisateur. Cela ouvre la voie à des applications de navigation plus précises, à des services de réalité augmentée basée sur la localisation, et à une meilleure intégration de la localisation dans les secteurs de la publicité et du marketing. Les LLM joueront un rôle essentiel dans le développement de la voiture autonome, de la logistique intelligente et des villes connectées. Les smartphones, en tant que principaux appareils de communication, sont destinés à devenir des outils clés pour la gestion de la mobilité, la sécurité et la personnalisation des services en fonction de la localisation de l’utilisateur.
Qualcomm apporte un savoir-faire notamment sur l’exécution des modèles qui sont gourmands en ressources sur des appareils alimentés par batterie peut vider rapidement la batterie. Les développeurs et les architectes de puces doivent optimiser leurs conceptions pour l’efficacité énergétique afin de ne pas créer d’effets négatifs notables sur la durée de vie de la batterie. Ils devront aussi s’assurer que des modèles développés fonctionnent sur diverses configurations matérielles et logicielles, ou que du matériel et des logiciels personnalisés seront disponibles pour prendre en charge les implémentations personnalisées.
La personnalisation sera un autre facteur de motivation clé pour les déploiements edge. Un LLM basé sur la périphérie peut apprendre comment l’utilisateur de l’appareil parle, comment il écrit, etc. Cela permet à l’appareil d’affiner les modèles pour répondre à la personnalité et aux habitudes spécifiques de l’utilisateur, offrant une expérience plus personnalisée.
Les LLM seront bientôt les principales caractéristiques des systèmes d’exploitation des smartphones. Ils vont aspirer toutes vos données de navigation, activité et données médicales, même les données financières, toutes les données qu’aujourd’hui que nous transmettons au cloud pourront être utilisées contre nous. Il est impératif de mettre en place des réglementations et des mécanismes de sécurité robustes pour protéger les données de localisation des utilisateurs.
La plupart des smartphones ont déjà suffisamment de CPU et de GPU pour exécuter ces modèles de langage volumineux personnels, mais ils ont besoin de plus de RAM, pour mieux réfléchir. Avec un peu plus de mémoire, nos smartphones peuvent devenir beaucoup plus intelligents.