Plateforme

Qu’est-ce que Common Voice By Mozilla ?

Par le

La voix est naturelle, la voix est humaine. C’est pour cela que nous souhaitons créer des technologies vocales de qualité pour nos machines. Mais réaliser de tels systèmes requiert un gigantesque volume de données vocales. La plupart des données utilisées par les grandes sociétés ne sont pas mises à la disposition de monsieur ou madame Tout-le-monde. Nous pensons que cela freine l’innovation. C’est pour cela que le projet Common Voice existe, c’est un projet qui doit faciliter l’accès à la reconnaissance vocale, pour tout le monde.

Les technologies vocales prolifèrent maintenant au-delà de certaines niches, et Mozilla pense qu’elles doivent être équitablement utilisables. Ils y voit un besoin d’inclure plus de langues, d’accents et de tranches d’âge pour la création et le test des technologies vocales. Mozilla souhaite que les jeux de données publique soient accessibles pour favoriser l’innovation et participent à la mise en place d’une concurrence saine pour les technologies vocales utilisant l’apprentissage machine. L’initiative démarre, il faudra en suivre l’exécution et l’utilisation dans le temps des ressources… Il est intéressant de noter que sur le site web du projet, il y a un lien qui permet de s’initier à la reconnaissance vocale qui pointe vers DeepSpeech 🙂

Le projet DeepSpeech est un moteur de synthèse vocale en open source, utilisant un modèle formé par des techniques d’apprentissage automatique, basé sur le document de recherche Deep Speech de Baidu. Le projet DeepSpeech utilise le projet TensorFlow de Google pour faciliter l’implémentation.

[l’objectif de collecte de son est fixé à 10 000 heures – C’est à peu près la quantité de données nécessaire pour être en mesure de produire un système de reconnaissance vocale de qualité.]

Qu’est-ce que Common Voice ?
Les technologies de reconnaissance vocale pourraient révolutionner nos interactions avec les machines, mais les systèmes disponibles à l’heure actuelle sont coûteux et propriétaires. Common Voice est un projet visant à rendre accessible à quiconque ce type de technologie. Les contributeurs partagent leurs voix dans une énorme base de données qui permettra à n’importe qui de rapidement et facilement réaliser des applications utilisant la voix. Toutes les données vocales seront mises à disposition des développeurs.

La voix est naturelle, elle est humaine. C’est notre manière la plus simple et naturelle de communiquer. Nous voulons que les développeurs soient en mesure de mener à bien de fabuleux projets, qu’il s’agisse de traducteurs en temps réel ou d’assistants administratifs. Mais à l’heure actuelle, il n’y a pas assez de données accessibles publiquement pour pouvoir réaliser ces types d’applications. Nous espérons que Common Voice donnera aux développeurs ce dont ils ont besoin pour innover.

Le jeu de données est disponible sous licence CC-0.