Menu
Servicesmobiles.frServicesmobiles.fr
Navigation : 
  • Tech
    • Mobile
    • Apple
    • Google
    • trackr.fr
  • BtB
    • OpenAI
  • Fintech
    • Crypto-monnaies
    • Revolut
En ce moment : 
  • Mobile
  • Innovation
  • Réseaux sociaux
  • Robot

L’avenir est-il multimodal pour les expériences vocales ?

BtB / Commerce / UX / Assistants vocaux
Par La Rédaction,  publié le 11 février 2020 à 13h38, modifié le 29 décembre 2020 à 16h59.
BtB
Photo : De Kolar.io - Unsplash

Photo : De Kolar.io - Unsplash

À mesure qu'elles gagnent en popularité, les expériences vocales ont le potentiel de stimuler l'engagement, la fidélité et même les comportements d'achat.

À mesure qu’elles gagnent en popularité, les expériences vocales ont le potentiel de stimuler l’engagement, la fidélité et même les comportements d’achat. Même avec la voix faisant partie des routines typiques des consommateurs, de nombreuses interactions peuvent être améliorées par l’ajout de visuels. C’est pourquoi les expériences multimodales deviennent si importantes pour connecter les entreprises et les consommateurs. Une enquête de Walker Sands a révélé que près de la moitié des consommateurs (49%) ne sont pas disposés à acheter des articles de luxe ou de la nourriture et des produits d’épicerie à l’aide d’un assistant vocal.

Des recherches supplémentaires de comScore aident à expliquer davantage pourquoi les consommateurs peuvent ne pas vouloir acheter ces types de produits via des assistants vocaux. Bien que la sécurité reste un élément dissuasif majeur pour le commerce vocal, certains autres sujets de préoccupation, tels que l’impossibilité d’afficher les détails du produit ou de comparer les produits, sont facilement résolus en ajoutant un élément visuel.

Il y a de nombreux avantages à offrir des expériences multimodales pour les bots et les assistant vocaux. Pensez à quelque chose d’aussi simple que de vérifier la météo, il est beaucoup plus efficace d’énoncer les résultats de la journée en cours et d’afficher des graphiques montrant les prévisions de la semaine entière que de lire tous les détails de chaque jour individuellement.

La voix est idéale pour obtenir des réponses rapides à des questions simples. Les visuels sont parfaits pour les tâches plus complexes. Que se passe-t-il donc lorsque vous combinez les deux ? Google offre ses perspectives sur les interfaces de robots multimodales.

En 2017 et 2018, Amazon et Google ont fait quelque chose qui a changé le jeu pour les concepteurs de chatbot. Ils ont ajouté des écrans à leurs assistants vocaux. Echo Show d’Amazon et Google Home Hub ont transformé ce qui avait été des haut-parleurs intelligents en autre chose, des machines que vous pouviez lire/parcourir et aussi parler/écouter.

Amazon et Google ont gagné la bataille pour le développement de la première nouvelle plateforme de communication depuis le smartphone. Leurs haut-parleurs intelligents ont conquis les médias et le public. Tout d’un coup, il est devenu acceptable de crier des questions à une machine inanimée dans votre cuisine. Oui, il y avait eu une recherche vocale sur smartphone (Siri et Google Assistant et Cortana) avant eux, mais Echo et Home ont vraiment consolidé l’idée de machines qui écoutent.

Ajout d’écrans

L’ajout d’écrans a donc déplacé la stratégie. Il a mis au défi les développeurs (et les concepteurs de conversations) de repenser leurs interactions avec les utilisateurs/clients. Il les a mis au défi d’être multimodaux.

Au lieu de réfléchir à la meilleure façon de répondre à une question dans le discours, ils doivent maintenant réfléchir à la meilleure façon de le faire en combinant la parole avec des visuels et même le toucher. La bonne nouvelle est que Google réfléchit depuis des années aux interfaces multimodales . Pourquoi ? Parce que depuis 2008 et ensuite Google Assistant sur smartphone à mixé les trois (parole, écran, touch)

Google Assistant est, bien sûr, le service qui anticipe les besoins d’un utilisateur. Il analyse diverses sources (calendrier, cartes, e-mail, habitudes de navigation, etc.) pour présenter des informations pertinentes. Par exemple, il vous rappellera une réservation de vol et suggérera le meilleur itinéraire d’où vous êtes. Les utilisateurs d’Android peuvent activer Google Assistant sur le téléphone. Ils peuvent lui parler et / ou regarder des informations visuelles.

Mais Google a toujours été clair sur le fait que l’Assistant peut-être actif sur d’autres surfaces : les appareils portables, la voiture, la télévision et plus encore.

Conception

Comme pour la conception d’une application, il faut se poser des questions pour le multimodal. Le contexte est également important. Par exemple, il peut y avoir un écran haute résolution sur un appareil embarqué, mais pour des raisons évidentes, les concepteurs devraient construire pour la voix dans cet environnement.

L’appareil est-il privé ou public ?
L’appareil est-il conçu pour des interactions individuelles ou une utilisation partagée ?
Quelle est la proximité de l’utilisateur avec l’appareil ? Il y a une grande différence entre un téléphone dans la poche et un téléviseur au mur
Quelle est la qualité et la quantité de l’intrant ? A-t-il plusieurs microphones et caméras ?
Quelle est la qualité et la quantité des sorties ? At-il un écran ? Est-ce en haute résolution ?

Avantage – Inconvénient

Avantage Interface vocale

    • C’est direct.
    • C’est universel. Aucun manuel de formation n’est nécessaire. Tout le monde sait parler.
    • C’est rapide – mais seulement lorsque vous savez exactement ce que vous voulez
    • C’est bon lorsque les mains et les yeux doivent être ailleurs (par exemple lors de la cuisson)

Inconvénient Interface vocale

  • C’est mauvais quand il y a de la complexité dans le service.
  • C’est éphémère. La voix disparaît dès qu’elle est prononcée.
  • C’est public. Il ne convient pas dans certains scénarios
  • Il ne permet pas la navigation
  • Cela demande de l’attention. L’utilisateur ne peut pas détourner l’attention.

Avantage Interface visuelle

  • C’est permanent et consultable. Les utilisateurs peuvent facilement réviser les réponses et revoir le matériel. Ils peuvent surfer et sortir.
  • C’est privé et discret par rapport à la voix.
  • C’est rapide (pour des tâches complexes)

Inconvénient Interface visuelle

  • Cela demande une certaine compétence technique. Les utilisateurs doivent comprendre les menus, etc.
  • Elle est lente (lorsqu’une réponse simple est recherchée).
  • C’est indirect – l’utilisateur doit faire la plupart du travail.

Retail

eMarketer a abaissé ses perspectives pour les acheteurs d’enceintes intelligentes (les consommateurs effectuant un achat via une enceinte intelligente) et les utilisateurs d’enceintes intelligentes (les consommateurs utilisant des enceintes intelligentes à toutes fins). L’utilisation des haut-parleurs intelligents faisait toujours face à des obstacles concernant la sécurité des paiements et la confidentialité. eMarketer souligne également l’absence d’écrans sur la plupart des haut-parleurs intelligents comme inhibiteur. Bien que les fabricants lancent des haut-parleurs intelligents avec écrans, de nombreux utilisateurs n’ont pas ressenti le besoin de mettre à niveau.

Les haut-parleurs intelligents ont été conçus comme des appareils d’entrée de gamme pour habituer davantage de personnes à la technologie à commande vocale.

Mais la planche de salut pourrait bien être l’écran ! Il y a beaucoup de friction dans le processus d’achat basé sur la voix, car les gens ne peuvent pas voir ce qu’ils achèteront réellement à moins d’avoir un écran sur leur haut-parleur intelligent. Bien qu’il existe des milliers d’applications pour les haut-parleurs intelligents qui vous permettent de commander des plats à emporter pour trouver des recettes ou jouer à des jeux, de nombreux consommateurs ne réalisent pas qu’ils doivent prendre des mesures supplémentaires et plus spécifiques pour utiliser toutes les capacités comme avoir un écran !

  • Les réponses visuelles renforcent la confiance
  • La simplicité est évidente
  • La confiance est moins évidente, mais tout aussi importante.

Les applications bancaires se révèlent être la troisième catégorie la plus utilisée sur les appareils mobiles (après les réseaux sociaux et la météo), et quelque chose comme la moitié de toutes les interactions sont des personnes qui vérifient leur solde. Bien que vous n’ayez aucun problème avec quelqu’un d’autre dans la salle qui vous demande votre solde, il est probable que vous ayez un problème avec lui en entendant combien vous avez en banque ou ce que vous devez sur votre carte de crédit. Vous ne ferez pas confiance à un système qui ne fournit pas cette réponse visuellement à votre écran mobile. C’est pourquoi nous considérons les services bancaires par la voix comme l’un des
avenirs de cette industrie.

Il en va de même pour les soins de santé, une autre industrie où la voix a un rôle important à jouer. Certains hôpitaux et cliniques mettent des haut-parleurs intelligents dans les zones d’attente pour les patients hospitalisés ou les services d’urgence, offrant des informations éducatives sur différents tests ou procédures. C’est un moyen non seulement de répondre aux questions de base, mais aussi de soulager l’anxiété. Lorsque vous concevez ces systèmes, vous devez faire très attention à la façon dont le système réagit. Vous ne pouvez pas non plus avoir de systèmes qui liront à haute voix le diagnostic d’un patient ou d’autres informations. la confidentialité (et les lois sur la confidentialité) exigent que les informations soient transmises à l’écran de l’appareil mobile du patient.

À voir une vidéo de 2018 qui parle des interfaces multimodales, comme l’avenir de la voix par Karen Kaushansky

Le Récap
  • Ajout d’écrans
  • Conception
  • Avantage – Inconvénient
  • Retail
En savoir plus
  • E-commerce : Google veut imposer un nouveau standard avec UCP
  • L’IA Alibaba.com qui débarque en Europe souhaite transformer le commerce BtoB
  • OpenAI se lance dans l’e-commerce : PayPal bientôt intégré à ChatGPT
Vous aimez nos contenus ?
Recevez chaque jour nos dernières publications gratuitement et directement dans votre boite mail
Recevoir la newsletter
  • A propos
  • Mentions Légales
  • Archives
  • Newsletter
  • Prix d’une application mobile
© 2026 - Tous droits réservés sur les contenus du site Servicesmobiles.fr  - ADN Contents -