Publié le 24 mai 2023, modifié le 24 mai 2023.
Par Christophe Romei

L’avenir de l’IA est une architecture hybride, device et cloud

Publié le 24 mai 2023, modifié le 24 mai 2023.
Par Christophe Romei

Qualcomm défend un avenir de l'intelligence artificielle (IA) qui doit être hybride, avec un traitement IA réparti entre le cloud et les appareils. Apple utilisera pour son casque cette approche une architecture IA hybride.

Alors que le géant Apple devrait annoncer aux développeurs lors de la WWDC23 son casque de réalité mixte, après avoir explosé 3 marchés avec l’iPod, l’iPhone, l’Apple Watch, les AirPods la question est : est-ce qu’il peuvent reproduire la création d’un marché avec leur casque AR/VR ? Il y a encore beaucoup de rumeurs et de fuites qui brossent un tableau assez clair de ce dont nous devons nous attendre. Il va embarquer deux chipsets, un pour la VR comme le Snapdragon XR2 Plus trouvé dans le Meta Quest Pro et aussi un M2, la même puce que dans les récents MacBook et Mac. De plus, il utilisera apparemment un écran micro OLED de 2 800 pixels et au lieu des contrôleurs, on pense que vous le contrôlerez avec juste votre main, voix et vos yeux.

Il est évident qu’ils utiliseront l’IA avec une architecture hybride dans ce type de casque. Pourquoi ? L’une des raisons, c’est l’émergence de l’IA générative qui marque également le premier pas vers une approche plus diversifiée et un paysage numérique personnalisé qui sera exploré par les utilisateurs. L’IA générative va démocratiser la création de contenu 3D puisque les concepteurs 3D peuvent développer du contenu 3D plus rapidement et plus efficacement avec les outils d’IA génératifs. Cela permettra non seulement d’accélérer la création d’expériences virtuelles immersives, mais aussi de réduire les barrières à l’entrée des créateurs individuels pour produire leur propre contenu.

Alors que l’adoption de l’intelligence artificielle générative progresse à des vitesses record et que les demandes informatiques augmentent, le traitement hybride est plus important que jamais. Une architecture d’IA hybride ou l’exécution d’IA sur l’appareil seul offre des avantages en termes de coût, d’énergie, de performances, de confidentialité, de sécurité et de personnalisation à l’échelle mondiale. Une architecture hybride d’IA distribue et coordonne les charges de travail d’IA entre les appareils cloud et de bord, plutôt que de traiter uniquement dans le cloud. Les appareils cloud et de bord – smartphones, voitures, ordinateurs personnels et Internet des objets (IoT) – fonctionnent ensemble pour fournir une IA plus puissante, efficace et hautement optimisée.

L’IA hybride va permettre aux développeurs et fournisseurs d’IA génératifs de profiter des capacités de calcul disponibles dans les appareils de pointe pour réduire les coûts. Une architecture d’IA hybride (ou exécutant l’IA sur le seul appareil) offre les avantages supplémentaires de la performance, de la personnalisation, de la confidentialité et de la sécurité à l’échelle mondiale. Par exemple, si la taille du modèle, l’invite et la longueur de génération sont inférieures à un certain seuil et offrent une précision acceptable, l’inférence peut s’exécuter complètement sur l’appareil. Si la tâche est plus complexe, le modèle peut s’exécuter sur le cloud et les appareils. De nombreuses applications commencent à faire travailler le smartphone et le cloud n’est utilisé que pour décharger les tâches d’IA que l’appareil ne peut pas effectuer suffisamment.

Mise à l’échelle de l’IA générative

Le potentiel de l’IA hybride augmente encore à mesure que les puissants modèles d’IA générative deviennent plus petits, tandis que les capacités de traitement sur appareil continuent de s’améliorer. Les modèles d’IA avec plus d’un milliard de paramètres fonctionnent déjà sur les téléphones avec des performances et des niveaux de précision similaires à ceux du cloud, et des modèles avec 10 milliards de paramètres ou plus devraient fonctionner sur des appareils dans un avenir proche. L’approche hybride IA est applicable à pratiquement toutes les applications d’IA génératives et les segments d’appareils, y compris les téléphones, les ordinateurs portables, les casques de réalité étendue, les voitures et l’IoT.

Le livre blanc écrit par Qualcomm montre que la demande accrue de calcul augmente à un rythme sans précédent, le traitement de l’IA doit donc être distribué entre le cloud et les appareils pour que l’IA évolue et atteigne son plein potentiel. La principale motivation est la réduction des coûts. Par exemple, le coût par requête de la recherche générative basée sur l’IA devrait augmenter de 10 fois par rapport aux méthodes de recherche traditionnelle. L’approche d’IA hybride est applicable à pratiquement toutes les applications et tous les segments d’appareils d’IA générative.

Lire aussi
Business

Z-commerce est Ze commerce

La génération Z représente près de 30 % de la population mondiale et devrait constituer 27 % de la main-d'œuvre d'ici à 2025. Les spécialistes...