Vers l’abolition des barrières linguistiques ? share
back to to

Vers l'abolition des barrières linguistiques ?

9 novembre 2012

Lorsque vous ordonnez à votre messagerie vocale de supprimer un message, la machine s’exécute … normalement. Car si la reconnaissance vocale a largement progressé ces dernières années, elle reste encore perfectible et les bugs fréquents.

Microsoft Research (MSR) a développé un nouveau système permettant de limiter sensiblement la marge d’erreur. Explications.

> La reconnaissance vocale encore imparfaite

Depuis l’invention de la reconnaissance vocale, plusieurs pistes ont été explorées concernant le langage, l’une des interfaces les plus naturelles, comme l’explique Rick Rashid, directeur de la recherche de Microsoft Research :

« Les premiers systèmes tentaient de capter les formes d’onde des voix, et essayaient de les faire coïncider avec des formes d’onde dont ils savaient qu’elles formaient certains mots. Mais cette approche est très fragile, d’une part, tout le monde parle différemment. De plus, chaque locuteur s’exprimera de manière différente en fonction du contexte dans lequel il se trouve.»

Plus tard, l’usage de techniques statistiques permettant d’extraire des données des locuteurs a permis de préciser le système. Sans pour autant le rendre infaillible.

> Diminuer encore la marge d’erreur

Les chercheurs du MSR et l’université de Toronto ont fait une nouvelle percée dans le domaine avec un nouveau système permettant de diminuer sensiblement la marge d’erreur :

« Leur idée était d’utiliser une technologie modelée sur la manière dont le cerveau humain fonctionne en calquant les réseaux neuronaux. 

[…] Ce modèle a permis d’augmenter les taux de reconnaissance vocale d’environ 30%. Globalement ça revient à faire passer la marge d’erreur de compréhension de la voix d’une faute sur cinq mots, à environ une sur sept » détaille Rick Rashid.

> Jusqu’à « abolir la barrière de la langue » ?

La méthode des statistiques combinée aux Big Data a également permis une avancée significative en matière de traduction. S’exprimant devant une assemblée d’étudiants chinois, Rick Rashid a ainsi fait une démonstration de la traduction en Madarin de son discours par le traducteur du moteur de recherche Bing en temps réel.

Mais l’innovation la plus intéressante réside certainement dans le fait que cette traduction était immédiatement récitée par la machine avec la voix du locuteur (voir la vidéo ci-dessous).

« Nous espérons ainsi abolir la barrière de la langue dans quelques années » a conclu le directeur général de la recherche du MSR.

Chaque semaine,
recevez les immanquables
par email