Publié le 4 janvier 2010, modifié le 15 décembre 2014.
Par La Rédaction

La synthèse vocale en 2010 par Antoine Kauffeisen CEO d’Acapela Group France

Publié le 4 janvier 2010, modifié le 15 décembre 2014.
Par La Rédaction

L’année 2010 sera faste pour la synthèse vocale notamment grâce à cinq paramètres favorables qui vont catalyser le taux de vocalisation des applications.

1) L’explosion de l’internet mobile

2) L’avènement des e-book Reader

3) Le Nuage

4) Le succès d’Avatar

5) L’e-ducation


L’explosion de l’internet mobile :

D’une part, l’accès à des applications connectées via Smartphones, tablettes, e-books, lecteurs multimédia, navigateurs GPS, etc. entraine une remise en forme des contenus. Ainsi, le rapport entre la petite taille des écrans – l’interface graphique – et la quantité des informations à transmettre crée une pression – (un entonnoir digital ?) – favorisant naturellement l’utilisation de l’audio et donc du Text to Speech (vocal) selon la formule suivante :
masse d’informations + petit écran + interface et contenu audio = augmentation de l’utilisation de la synthèse de la parole à partir du texte.

L’avènement des e-book Reader
:
Même si l’annonce d’Amazon sur le fait d’avoir vendu plus d’e-books que de livres papier à Noël doit être replacée dans son contexte, elle donne néanmoins le « la » pour l’année 2010 à la symphonie «les aventures des éditeurs dans la jungle de la digitalisation ». Contrairement à la musique, digitalisée à 95%, le livre reste le « parent pauvre » du taux de digitalisation. Or la synthèse vocale se nourrit de texte digitalisé. Si le taux de digitalisation – et de lecture – augmente, le besoin en lecture de contenu texte par la synthèse augmente.

Le Nuage :
Une des caractéristiques passionnantes de la synthèse vocale est son multilinguisme intrasèque. Toute langue a droit à sa synthèse vocale. Aujourd’hui, une trentaine de langues est couverte par une synthèse de qualité quand il en existe 105 officielles, 200 écrites et des milliers de langues parlées, la synthèse ne s’intéressant qu’aux langues écrites bien sûr.
On estime que les langues majoritaires en 2100 seront l'anglais pour le commerce et les échanges scientifiques, l'espagnol en Amérique Latine (et au sud des États-Unis), le portugais en Amérique du Sud et en Afrique, l'arabe dans le monde arabe, le mandarin et l'hindi en Asie et le swahili et le wolof en Afrique (source : Colette Grinevald).
Il existe un rapport entre le Nuage et les langues. En effet, le Nuage est l’outil idéal de la diffusion de la synthèse dans le monde car il rend possible son utilisation de manière simple et efficace dans les endroits les plus éloignées.
Le Nuage rend possible l’utilisation de la synthèse vocale aussi bien dans une petite application Flash d’apprentissage de l’anglais développée par les professeurs pour les élèves d’une petite école que dans une application d’e-learning pour une force de vente de milliers de commerciaux d’un grand compte répartis dans le monde entier. Le nuage permet ainsi de faire évoluer la synthèse vocale en temps réel pour le bénéfice des utilisateurs qui deviennent alors contributeurs d’améliorations. Comme beaucoup de technologies, la synthèse vocale ne s’améliore que quand elle est utilisée.

Le succès d’Avatar :
En quoi le succès d’Avatar est-t-il un paramètre de développement de la synthèse en 2010 ?… Avatar et Robots ne sont vivants que quand ils parlent et les faire parler avec la synthèse est bien plus simple et économique que d’essayer de reproduire le mécanisme complexe de la création du son dans le larynx !!! Aussi anecdotique que puisse apparaître le succès d’un film, il ne faut pas négliger son effet éducatif et incitatif auprès de nos futurs utilisateurs.

L’e-ducation : 
Quelque soit le nom que l’on veut lui donner – e-learning, université numérique etc., l’éducation et l’enseignement par des biais digitaux nous envahissent quotidiennement pour nous aider à comprendre plus rapidement et plus facilement le monde qui nous entoure. La voix est un vecteur naturel de l’enseignement ergo la voix de synthèse se retrouve naturellement dans l’e-ducation. 

Conclusion
Voici en quelques mots ce que va vivre la synthèse vocale en 2010 en sachant qu’elle continuera – en tâche de fond – son travail incessant et irremplaçable d’accessibilité à l’information pour les utilisateurs ne sachant ou ne pouvant lire ou parler de par leur situation ou leur état.

Lire aussi