App

Qwaz Audio, le son au service du Texte

Par le

Qwaz Audio

Après avoir été physicien-chercheur, Denis Delbecq, enseignant et développeur de logiciels, a rejoint la presse il y a 23 ans, dans le staff de journaux français comme SVM, Le Monde et surtout Libération. Indépendant depuis 2007, il travaille pour des titres aussi variés que le Temps (Suisse), le Monde, La Recherche, Alternatives Internationales, Science & Vie, Tout Comprendre et le site d’Arte Future. il développe aussi des outils et des technologies pour sensibiliser les enfants à leur environnement sur iPhone et Raspberry Pi.

Il vient de lancer, une application qui permet de ralentir un enregistrement pour l’adapter à sa vitesse de frappe ! Qwaz Audio

Comment avez-vous eu l’idée?
Je développe des applications à usage personnel depuis douze ans, notamment pour améliorer ma productivité de journaliste. J’ai eu l’idée de développer ces applications il y a trois ans, quand les technologies de smartphone et de tablette ont atteint suffisamment de maturité pour devenir de vrais outils de travail. Faute de pouvoir transcrire les interviews de manière automatique, par la reconnaissance vocale, j’ai donc entrepris de développer un outil permettant d’accélérer la transcription manuelle. Après de nombreux tests, il est apparu que la plus grosse perte de temps quand on retranscrit est provoquée par les incessants pauses et rembobinages. C’est sur ce point que j’ai travaillé.

Que ce soit sur iPhone ou iPad, ces applications divisent, en moyenne, par deux à trois le temps consacré à la retranscription (suivant la vitesse d’élocution de la personne, la technicité du vocabulaire, la langue utilisée par la personne interviewée, etc.)

Quelles sont Les fonctionnalités  ?

Il y a deux applications: Qwaz Audio, ciblée sur l’iPhone, et Qwaz Pro, pour iPad.

Qwaz Audio : c’est un magnétophone et lecteur audio intelligent, qui permet de ralentir un enregistrement pour l’adapter à sa vitesse de frappe (on utilise son ordinateur pour écrire), tout en maintenant la tonalité d’origine de la voix (voir Démonstration de la technologie audio Qwaz en français). L’application propose deux vitesses, réglables indépendamment: l’une, ralentie, pour la retranscription. Et l’autre, accélérée, pour passer plus vite sur des passages que l’on ne souhaite pas retranscrire. De plus, l’application permet de rembobiner automatiquement la bande en cas de pause, d’une durée réglable. Qwaz Audio est doté de marqueurs, pour se repérer facilement lors de la réécoute d’un enregistrement. Enfin, quand on travaille au casque, un système de reconnaissance vocale (en anglais) permet de contrôler les principales fonctions du player audio. Les enregistrements peuvent être transféré par email, sauvegardés via iTunes, ou téléchargés dans l’iCloud Drive de l’utilisateur.

Qwaz Pro reprend l’essentiel des fonctions audio de Qwaz Audio (à l’exclusion de la commande vocale), et les intègre dans un traitement de textes. De cette manière, l’iPad devient un véritable couteau-suisse pour l’écriture et la retranscription, qui sert de magnétophone et d’outil d’écriture (avec le clavier virtuel ou un clavier Bluetooth). Des marqueurs audio interactifs sont placés directement dans le texte à la demande. Interactifs puisqu’ils permettent de repositionner un enregistrement à la position correspondante pour faciliter une réécoute.

Qwaz Pro est aussi doté de nombreuses fonctions d’aide à l’écriture (conversion automatique de monnaies, analyse statistique des textes et de leur cohérence, détection de «tics d’écriture», correction des mots proches, etc.

Quelles technologies sont utilisé ?
Qwaz Audio et Qwaz Pro sont tous deux équipés de la technologie Dirac de traitement du signal, développée par l’ingénieur allemand Stephen Bernsee (DSP Dimension), qui est couramment utilisée dans le cinéma et la télévision.

Qwaz Pro utilise également des algorithmes que j’ai développé, notamment pour la détection de mots proches (chaînes de Markov et analyse entropique), et l’extraction automatique de mots-clés (traitement statistique du langage) pour vérifier la cohérence des textes. D’autres technologies sont en cours de développement, notamment pour une gestion optimale de la batterie lors des longs enregistrements, et un renforcement de la sécurisation des enregistrements.

Votre cible ?
Ce sont les personnes qui ont de gros besoins de retranscription d’enregistrements sous forme de texte. Les journalistes bien évidemment, mais aussi les chercheurs en sciences humaines, les attachés de presse, les étudiants. De même, Qwaz Audio et Qwaz Pro peuvent rendre de grands services aux producteurs de télévision (retranscription des dialogues en vue de leur traduction, par exemple), aux professions médicales (compte-rendus d’examens), etc. Qwaz Audio est aussi un excellent outil pour les musiciens qui souhaitent retranscrire disques et enregistrements sous forme de partitions.