Expert

Voice Assistant, année zéro !

Par le

Ce n’est pas la première foi que j’écris sur le sujet, persuadé comme beaucoup que la voix est l’usage normal pour interagir avec son environnement. L’un des films qui a su le mieux transmettre le potentiel d’une interface vocale c’est Iron Man avec Jarvis. Puis en 2016 Mark zuckerberg a essayé d’installer une intelligence qui pilote sa maison, ses rendez-vous de la journée, apprend à sa fille à parler chinois, reconnaît les visiteurs qui se présentent à la porte et gère sa musique. La principale difficulté qu’il a rencontrée : faire communiquer l’intelligence artificielle avec chacun des appareils connectés de la maison, quel que soit le langage et le protocole qu’ils utilisent. Certains objets n’étant pas connectés, comme le grille-pain, il a fallu parfois ruser – en y ajoutant un interrupteur connecté. (voir la vidéo ci-dessous)

Nous somme maintenant en 2018 et les choses prennent forme avec les assistants vocaux créés par Amazon et Google. Il y a quelques jours, la 1er conférence « Smart Voice Summit » autour des Voice Assistant a eu lieu avec des acteurs de nombreux pays, organisé par l’une des plateformes de développement Smartly AI

Ci-dessous vous allez retrouver quelques arguments et idées qui me font penser que c’est l’année Zero, que le développement des applications et des usages ira beaucoup plus vite que le mobile. Ne ratez pas le train, comme le #mobile, pour certains 🙂

[À votre dispo pour en parler et allez plus loin, l’écosystème est à construire en France] 

C’est maintenant et c’est le tout début de ce marché, pour l’instant en Europe, il y a zéro plateforme !! Une dizaine dans le monde avec 2 leaders Amazon et Google. Orange aura fort affaire avec un vrai défi pour installer et imposer son offre Voice Djingo pas simplement pour ses clients, mais pour créer un écosystème aussi vertueux que celui d’Amazon, depuis 2014 (plateforme puissante) !! Mais Apple arrive avec Homepod qui embarque SIRI (2011) pour son écosystème – Il y aura des nouveaux métiers à créer, des nouvelles compétences a développer dans vos équipes et un nouveau #business – surement aussi fort que celui des #applications.

Notez ceci pour vos premiers pas !

1 Vous ne serez pas capable de vivre sans stratégie vocale majeure
2 Apportez une valeur unique à vos clients grâce à la voix
3 La voix va activer vos fonctionnalités de base
4 Pensez gros, commencez petit

Amazon Développeur – Alexa

Google Développeur – Assistant

Apple Développeur – Siri + Apps

Market US dominé par Amazon

La chaine de valeur UK en avance ( plateforme, designer, développeur, agence)

Vous pouvez lire les articles (17) sous le TAG #voicefirst pour avoir en tête les enjeux de ce nouveau marché.

[“Our 2017 projections for #Alexa were very optimistic, and we far exceeded them. We don’t see positive surprises of this magnitude very often — expect us to double down,” “We’ve reached an important point where other companies and developers are accelerating adoption of Alexa. There are now over 30,000 skills from outside developers, customers can control more than 4,000 smart home devices from 1,200 unique brands with Alexa, and we’re seeing strong response to our new far-field voice kit for manufacturers. Much more to come and a huge thank you to our customers and partners.” said Jeff Bezos, #Amazon founder and CEO]

2 dangers

La fragmentation et les applications ! Tout comme le marché du mobile, la voix risque de très vite se confronter à de nombreuses plateformes, environ une dizaine au moment où nous écrivons ces lignes ! C’est sûr il y en aura beaucoup plus, c’est un vrai risque pour le consommateur – Tout comme il y a eu des dizaines d’OS pour le mobile avec au final 2 gagnants. Il y a quand même une différence notable en 2018 la technologie (Algorithmes, AI, sensor, processeur) permet d’aller beaucoup plus vite !! Pour ceux qui développent il faudra aussi choisir les bonnes plateformes. Bien que des outils de développement existent pour construire votre scénario vocal, comme dans le mobile. De véritable enjeux existent pour ces players qui seront de suivre de prés les nouveautés et outils de développement des principales plateformes.

Rappelons aussi, que ce qui a fait le succès d’une seule plateforme à ce jour en terme de chiffre d’affaire et d’expériences utilisateurs c’est l’App Store. En faite personne n’a su donner les capacités qu’a donné Apple aux applications et personne n’a compris son succès à l’époque : Garantir la qualité des applications aux travers des guideslines et d’un tunnel de validation trés rodé maintenant. Cela a aidé  la communauté des développeurs à bien gagner leur vie. Quand on regarde les chiffres d’Amazon sur le nombre de skill présent, cela peut devenir problématique pour eux sur la qualités des services rendu. Google à l’air d’avoir compris ses erreurs du début sur mobile et valide les applications vocales en fonction de cas d’usage trés précis.

C’est tout de même le temps de lancer votre stratégie vocale et de concevoir une expérience vocale pour vos métiers, clients, prospects. Le monde est votre écran avec des interactions multimodales. Geste, voix, regard de l’oeil, empreinte … mais la voix s’imposera dans de nombreux domaines, la voiture et la maison seront en priorité les endroits de son développement naturel.

Prendre le bon Train de la conception

Pour l’instant, l’un des enjeux primordiaux c’est la conception du scénario que vous souhaitez dérouler aux questions de vos utilisateurs. La conférence a trés bien mis en évidence ce point durant les 2 jours. L’utilisateur du service comme pour le mobile doit-être au centre, c’est lui qui va piloter une interface, ne l’oublier pas, qui n’est pas visuel !

– Quand il est facile de créer, on commence à construire et on oublie de concevoir
– Commencez avec l’utilisateur, le reste suivra
– Les attentes des utilisateurs autour des assistants vocaux augmentent ! Alors maintenez vos utilisateurs engagés en abordant leurs problèmes, en tenant compte de leurs retours et en faisant évoluer vos compétences en permanence.

Google à bien insister sur les persona, créer les personnalités virtuelles les plus naturelles ou les «persona» de l’industrie voice qui vous représenterons ! Google a utilisé des «conteurs» de Pixar et The Onion, entre autres, pour élaborer des réponses scriptées à un large éventail de questions. Nous devons apprendre aux robots comment parler humain !

« We’re assuming that the other participants are following the conversational rules : be truthful, informative, relevant and clear. » Google Senior UX design Peter Hodgson

Il y a eu de nombreux témoignages comme Deezer, BBC qui sont pionniers en la matière. Pour Deezer, le thème de sa présentation « The world’s most personal music streaming company », tout un programme ! Il faut parler naturellement à son smart speaker, interagir avec la musique comme parler à un ami, il faut que vos équipes gèrent les intelligences complexes mais pas seulement à travers les algorithmes. La Reconnaissance vocale c’est de la personnalisation et de la contextualisation pour une expérience unique pour chaque instant. Le challenge aussi pour Deezer c’est de donner cette expérience à leur communauté.

Les usages sur les smart speakers

Enlever les frictions

BBC met beaucoup d’efforts et d’argent dans la voix, à travers de la R&D, des équipes pour produire du contenu et des nouveaux formats de programmes pour créer des nouveaux business models, développer un ensemble d’outils et de techniques UX. Ces appareils représentent une opportunité pour une radio personnelle et connectée que la BBC  souhaite exploiter, imaginez pouvoir par exemple, interroger un article de presse 🙂

Plusieurs approches sont possible pour construire les histoires avec la voix  :
Tellables, les histoires sont seulement lues par Alexa
Selectastory, Alexa ne devrait pas être l’unique voix
Les histoires interactives ne représentent qu’environ 30 000 mots, et sont donc la parfaite introduction à votre écriture et un moyen de mettre vos œuvres traditionnelles devant un public nouveau. Quand l’utilisateur arrivera à la fin de votre histoire, ils entendront quelque chose comme: « Hé, si vous avez aimé cette histoire, vous aimerez le roman de l’auteur Y. » Ils peuvent même acheter alors vos livres à ce moment.
Noveleffect, quand vous lisez une histoire, elle se synchronise sur un paysage sonore approprié.

Le marché des enfants entre la lecture et les jeux sont 2 axes très fort du développement de ces assistants vocaux – L’un des concepteurs de jeu sur Alexa, labworks a rappelé que l’un de ces jeux était en 3 position des usages sur le store, il avait 250k d’utilisateurs par mois en décembre 2017. 3 sur 4 des utilisateurs pouvaient, y jouer 5 fois.

Bien sûr il y a beaucoup de cas d’usages selon vos métiers mais gardez à l’esprit les conseils suivants :

Un bon #skill devrait:
– Avoir un but clair
– Évoluer avec le temps
– Parlez naturellement
– Comprendre la plupart des entrées
– Toujours répondre de manière appropriée
– Soyez multimodal

Qu’est-ce qui fait un « great » skill
– Résoudre un problème client
– Garder les utilisateurs engagés
– Rester facile à utiliser
– Toujours pertinent pour la marque
– Encourager une utilisation répétable
– Fournir une valeur unique

La clé

Soyez conscient que la clé c’est investir dans la conception, le prototypage rapide et l’apprentissage des tests – Une des entreprises présentent a rappelé quelques points importants sur le sujet.

– obtenir le design 90% juste avant qu’une ligne de code soit écrite
– challenge : puis-je passer d’une idée d’interface vocale à un test, en moins d’une heure ?
– écrire un exemple de dialogue dans un fichier texte
– couvrir les 80% dés la 1er itération
– sortez de la réponse humaine
– lancez votre test
– répétez
– vous savez que le design fonctionne quand il tue vos premières idées 🙂

https://voiceguidelines.clearleft.com/
https://www.manning.com/books/voice-applications-for-alexa-and-google-assistant
https://voiceui.fjordnet.com/
http://www.opearlo.com

IL reste tout de même en cette année Zero du business la reconnaissance vocale, des limitations à la voix, c’est lié à ce que l’on appelle la conscience contextuelle, le fait d’avoir besoin de plus d’informations d’utilisateur. L’appel à entrer dans la conversation est encore maladroit, il y a besoin d’invocations implicites.

Ci-dessous quelques photos prises pendant la conférence.

SmartVoiceSummit 2018