Reconnaissance vocale : la recherche franchit un nouveau palier share
back to to

Reconnaissance vocale : la recherche franchit un nouveau palier

Microsoft Research 22 septembre 2016
Une équipe de chercheurs vient d’atteindre un nouveau palier dans le développement de logiciels de compréhension du discours humain par ordinateur. Explications avec Microsoft Research.

Il y a 20 ans, le meilleur logiciel de reconnaissance vocale disponible sur le marché se trompait sur… près d’un mot sur deux (43%). Aujourd’hui, le taux d’erreur par mot (WER – word error rate) est proche de 6%.

6,3% pour être précis, selon une évaluation récente réalisée par des chercheurs de la cellule de Microsoft Research dédiée à la parole et au discours :

« L’équipe que nous avons composée vient de mettre à profit un siècle de recherche et développement en repoussant les limites des technologies de reconnaissance vocale », a commenté Geoffrey Zweig, directeur du groupe de recherche.

Une nouvelle étape qui « résulte des technologies développées par la communauté de l’intelligence artificielle et ses nombreuses organisations depuis les vingt dernières années », a précisé Xuedong Huang, chief speech scientist.

Selon certains chercheurs, ce pourcentage permet de légitimer le fait que la compréhension du discours par ordinateur arrive désormais au niveau de celle des humains. En d’autres termes, vous avez autant de chance de vous faire comprendre de votre voisin que de votre ordinateur.

Si, pour l’heure, de telles avancées vont rapidement permettre de renforcer les solutions de chatbots et d’intelligence artificielle personnalisées, l’objectif est, à terme, de proposer des produits et services capables de d’entendre et de comprendre le langage pour accompagner les gens dans toutes leurs activités.

Pour en savoir plus, c’est par ici.

Chaque semaine,
recevez les immanquables
par email