Publié le 9 janvier 2018, modifié le 5 mars 2021.
Par La Rédaction

[CES2018] Tsunami of the Voice

Publié le 9 janvier 2018, modifié le 5 mars 2021.
Par La Rédaction

Sous le slogan «connected devices connecting everything», le CES de cette année sera davantage axé sur l’intelligence artificielle combinée avec les plates-formes matérielles et logicielles des géants technologiques mondiaux. Le PDG d’Intel, Brian Krzanich, a prononcé son discours sur les possibilités infinies de l’ère technologique axée sur les données notamment sur les révolutions technologiques du Big Data dans des domaines tels que la communication réseau 5G et les véhicules autonomes.

Le mois dernier, la société a lancé son unité de recherche axée sur l’intelligence artificielle, Samsung Research, à Séoul, accélérant sa volonté d’étendre son leadership en matière de matériel informatique dans le secteur des logiciels. Le géant de la technologie a récemment repris une start-up basée à Séoul, Fluenty, détenant une expertise dans le machine learning et les technologies Big Data autour de la messagerie et de la voix.

Hyundai Motor, constructeur automobile prévoit de dévoiler au CES le premier prototype de cockpit qui intègre un assistant avec la reconnaissance de la voix qui va permettre de suivre le rythme, les besoins de données en temps réel des conducteurs, il sera déployé dans de nouveaux modèles qui seront déployés dès 2019. La technologie est basée est basé sur la plate-forme d’intelligence artificielle Houndify de SoundHound (10 ans de recherches) L’agent personnel intelligent est unique en ce sens qu’il agit comme un système d’assistance proactif, prédisant les besoins du conducteur et fournissant des informations utiles. La reconnaissance vocale sophistiquée et l’intégration avec l’AI sont essentielles pour fournir efficacement aux conducteurs le contenu et les données massifs que les futurs véhicules connectés auront à offrir.

les ventes d’assistants vocaux ont progressé de 103% d’une année sur l’autre au quatrième trimestre de 2017 selon un rapport d’Adobe. L’analyse d’ADI est basée sur des données de consommateurs agrégées et anonymisées de plus de 55 milliards de visites à plus de 250 détaillants aux États-Unis, ainsi qu’une enquête auprès de plus de 1 000 consommateurs américains. Selon l’enquête, plus de la moitié des consommateurs qui possèdent un assistant vocal l’utilisent au moins une fois par jour, et 22% des personnes qui possèdent un appareil d’assistance vocale ont indiqué qu’ils magasinaient à l’aide de commandes vocales.

[2% des consommateurs britanniques utilisent déjà des appareils à commande vocale tels que Google Home et Amazon Echo pour faire leurs achats en ligne, soit 20% de tous les devices au Royaume-Uni, selon les résultats de la recherche Kantar Worldpanel ou équivalent à 9,96% du total des ménages britanniques sur la base des derniers chiffres de l’ONS.]

Ci-dessous dans la vidéo le travail de Peugeot avec Cap Gemini sur le même sujet.

LG ouvrant son tout premier laboratoire AI en juin a sorti une série de dispositifs robotiques alimentés par intelligence artificielle, y compris un robot de guidage d’aéroport reconnaissant la voix.

Ce n’est que quelques exemples,  la voix s’installe durablement pour piloter les interfaces et la technologie, quoi de plus naturel que de parler, compréhensible de tous !! Même si beaucoup de gens qui utilisent Alexa sont frustrés par son manque de compréhension. La technologie vocale devrait évolué pour comprendre l’émotion. Selon Gartner, les assistants personnels virtuels basés sur les locuteurs devraient évoluer pour comprendre les émotions humaines. La société a prédit que d’ici 2022, les appareils personnels en sauront plus sur l’état émotionnel d’une personne que sa propre famille. L’IA génère de multiples forces perturbatrices qui remodèlent notre façon d’interagir avec les technologies personnelles. Par exemple, la start-up basée à New York Emoshape a développé son propre processeur optimisé pour gérer les données émotionnelles. Il se consacre à fournir une technologie qui enseigne des objets intelligents comment interagir avec les humains pour obtenir un résultat favorable.

Ci-dessous des annonces sur le CES 2018 autour de la voix (on mettra à jour au fil de l’eau)

1/ Roku a annoncé son intention de pénétrer le marché des appareils à commande vocale grâce à un nouveau programme qui permettrait à d’autres fabricants de s’intégrer à la plate-forme vocale de Roku dans leurs propres haut-parleurs intelligents, soundbars et autres. Cette barre de son est le premier appareil à tirer parti de la technologie de Roku Connect. L’appareil peut être utilisé avec n’importe quel téléviseur pour offrir une expérience sonore de qualité supérieure, comme le font les barres sonores, mais les consommateurs sont censés l’acheter pour les fonctions Roku Connect.

Lorsqu’il est installé avec l’un des téléviseurs Roku existants (comme celui de TCL), la barre de son ajoute des capacités voix et audio mains libres au téléviseur. Par exemple, vous pouvez indiquer à votre téléviseur de syntoniser un canal Roku en particulier, de lire ou de mettre en pause la programmation, de l’allumer ou de l’éteindre, de programmer une mise en veille, de lire de la musique et bien plus encore. La barre de son sera également capable de fonctionner avec tous les autres appareils compatibles Roku Connect dans la maison, y compris les haut-parleurs intelligents.

Le produit arrivera vers la fin de 2018.

2/ La voix devenant l’interface utilisateur principal des services d’assistance basés sur le cloud, un signal vocal clair est nécessaire pour garantir la précision et l’intelligibilité des assistants conversationnels tels qu’Alexa, DuerOS de Baidu, Bixby, Cortana, Assistant Google et Siri. Les casques d’écoute, les haut-parleurs intelligents, les téléphones portables, les dispositifs portables, les systèmes d’infodivertissement automobile et de sécurité résidentielle ne sont que quelques-uns des marchés importants que les fournisseurs et les fabricants de puces ciblent avec des services vocaux. Cependant, ils font face à des obstacles technologiques importants pour incorporer et configurer des algorithmes complexes tels que la formation de faisceau multi-mic, l’annulation d’écho acoustique multicanaux et la suppression du bruit dans leurs produits.

Afin de réduire les importantes barrières à l’entrée sur ces marchés, CEVA a introduit ClearVox. Développé en interne et s’appuyant sur la vaste expertise CEVA dans le traitement audio et vocal, ClearVox incorpore des algorithmes avancés qui traitent différents scénarios acoustiques et configurations de microphone, notamment un logiciel optimisé pour la direction d’arrivée des enceintes, la formation de faisceau multi-mic et l’annulation d’écho acoustique. ainsi que le logiciel de pilote et de firmware associé.

Autre plateforme (voice, vision, biometrique, language naturel), TrulyHandsfree de Sensory, et la solution logicielle de contrôle de la parole et de la voix très largement utilisée, à révolutionné les interfaces utilisateur voix en offrant un système de reconnaissance vocale embarqué à succès. Une nouvelle approche d’apprentissage permet de la faire fonctionner en ultra-faible puissance et avec un minimum de mémoire et de MIPS. Aujourd’hui, TrulyHandsfree peut être trouvé dans les principaux téléphones mobiles, applications, caméras d’action, appareils IoT, et même des jouets! (3Nod, Abalta, Amazon, Anoni, AONI, Binatone, Blue Frog Robotics, Braven , Caavo, Cleer, Doss, Garmin, Salut Miroir, Holimotion, Honeywell, Huawei, LG, Libre, Liaison, Logitech, Mitsubishi, Motorola, NVidia, Plantronics, Samsung, Simplehuman, Parler de la musique, Sugr, Voicebox, Vuzix, Google Waze et ZTE.)

Qualcomm se positionne aussi sur le sujet avec la plate-forme Qualcomm Smart Audio qualifiée par Amazon pour le service vocal d’Alexa (AVS) qui incluent la technologie de microphone à 6 voix Far-Field Voice et la détection de mot toujours active pour une activation vocale précise et précise, des algorithmes de lecture et de post-traitement Hi-Fi intégrés.

3/ Les recherches de Jabra montrent que l’utilisation quotidienne des casques par les utilisateurs fréquents se concentre sur les appels (58% des utilisateurs chaque jour), la musique (53%) et le contrôle vocal (35%). Elite est conçue pour répondre aux besoins des utilisateurs qui recherchent non seulement une qualité musicale exceptionnelle, mais aussi une capacité vocale forte, qu’ils effectuent des appels ou qu’ils utilisent des assistants vocaux tels qu’Amazon Alexa , Siri ou Google Now . Avec la famille de produits Elite, les utilisateurs n’ont plus à faire le choix entre de superbes casques audio ou un casque conçu pour la voix et les appels – ils peuvent désormais avoir les deux.

Au CES, Jabra présente trois nouveaux produits: Elite 45e, Elite 65t et Elite Active 65t. Les nouveaux produits permettent le support vocal pour tous les principaux services vocaux, y compris maintenant Amazon Alexa sur le pouce. Jabra est parmi les premiers à activer cette fonctionnalité mobile, offrant aux clients un accès à Alexa directement à partir des écouteurs. Avec Alexa, les utilisateurs peuvent demander à jouer de la musique, écouter les nouvelles, vérifier la météo, contrôler les appareils intelligents, et bien plus encore…

4/ Amazon Alexa Voice Service (AVS) permet aux développeurs et fabricants d’intégrer Alexa directement dans leurs produits connectés, sans avoir besoin de connaissances en langage naturel ou de spécialistes de la reconnaissance vocale dans leur équipe. le kit de développement vocal Amazon Alexa Premium Far-Field va faciliter la création de produits compatibles Alexa avec des performances haut de gamme.

5/ Baidu DuerOS cherche des partenaires dans tous les domaines de la maison intelligente pour lancer une série de produits intelligents avec des capacités de contrôle de la voix. La maîtrise de l’éclairage LED de Sengled permet d’obtenir une lampe à commande vocale de Chine, c’est une fusion de son et de lumière en un seul appareil.  Le moteur interactif Baidu DuerOS fournit des capacités de données complètes qui peuvent être déverrouillées au son de la voix. Équipé de la technologie de réduction du bruit et de six microphones de champ proche et lointain, les commandes vocales de l’utilisateur seront facilement reconnues par le Sengled Smart Lamp Speaker.

6/Avec Bixby, Samsung apporte son service personnalisé à plus d’appareils. En 2018, les téléviseurs intelligents du géant et les nouveaux réfrigérateurs Family Hub bénéficieront d’un contrôle vocal via Bixby pour faciliter les tâches quotidiennes.

7/ CopyCat de modèle Asiatique 🙂 Google lance son écrans intelligents assistés avec quatre appareils de lancement fabriqués par Lenovo, JBL, Sony et LG annoncés au CES 2018. l’intégration de l’assistant Google activé par la voix, un écran tactile vous permet de regarder des vidéos YouTube, de visionner des photos via Google Photos et d’appeler des personnes à l’aide de Google Duo.

8/ Les systèmes Crestron peuvent désormais intégrer l’Assistant Google pour activer les commandes d’éclairage. La marque de domotique travaille avec Google sur la deuxième phase du contrôle vocal pour les systèmes complets de maison intelligente. C’est un bon début pour les clients de Crestron dans le domaine de l’automatisation, et les intégrateurs qui peuvent s’attendre à proposer une assistance Google beaucoup plus étendue dans un proche avenir… La domotique traditionnelle va permettre de déclencher par exemple les commandes d’éclairage par la voix, les utilisateurs peuvent simplement parler à l’assistant Google le plus proche, par exemple, «OK Google, allumez les lumières de la cuisine». Il est fort à parier que d’ici 2/3 ans, ce sera des équipements fournit par les constructeurs de maison !

9/ L’un des top 3 des services utilisés sur smartphone, la météo, sur les assistants vocaux il en sera de même ! AccuWeather pour l’assistant Google propose une gamme de prévisions météorologiques et de l’information, y compris dans le monde entier. Il y aura des prévisions à 15 jours, les conditions actuelles pour un endroit précis à l’échelle mondiale, des informations sur les alertes météorologiques sévères aux États-Unis.

L’application permet de poser des questions simples concernant les prévisions. Lorsque les utilisateurs demandent l’application AccuWeather, « Ai-je besoin d’un parapluie ? » ou « Quand l’arrêt de la neige, est-elle prévu ? » ils entendront les recommandations les plus appropriées en fonction des prévisions. Près de 2 milliards de personnes dans le monde comptent sur AccuWeather !

10/ Mercedes lance son tout nouveau système multimédia embarqué baptisé MBUX. La firme s’est associée à Nuance afin d’améliorer l’expérience utilisateur du contrôle vocal.

[En dehors du CES, des étudiants ingénieurs qui déménagent à Tooker House, une nouvelle résidence pour les ingénieurs sur un campus, peuvent choisir de recevoir un nouveau Amazon Echo Dot et de faire partie de la première communauté résidentielle vocale sur un campus universitaire. Les étudiants de première année pourront développer leurs propres compétences ou aptitudes Alexa, et rejoindre la croissance communauté de développeurs de voix.]

Lire aussi