Aller au contenu

Jean-Paul HATON Parlez, la machine fera le reste…
principes et applications de la reconnaissance automatique de la parole

Date : 07.05.2015 — Audio 108 min.

Les systèmes actuels d’interaction homme-machine font de plus en plus appel à des entrées-sorties vocales : téléphones cellulaires de dernières générations, systèmes GPS, téléphones « mains libres », etc. Parler à une machine devient ainsi une activité presque banale…

Ce cours concerne la reconnaissance automatique de la parole, discipline englobant l’ensemble des méthodes et techniques pluridisciplinaires permettant à une machine de reconnaître un mot ou une phrase prononcés par un locuteur humain en vue de procéder à une certaine action. Les difficultés spécifiques de la reconnaissance sont nombreuses : nombre variable de locuteurs connus ou inconnus du système, microphones variés, bruit ambiant, accents, effets liés au local dans lequel se trouve le locuteur (écho, réverbération).

Cet exposé présentera de façon simple et accessible les principes de la reconnaissance automatique de la parole, ainsi que les niveaux fonctionnels d’un système : prise de son, paramétrisation du signal vocal, reconnaissance de formes (en insistant sur les modèles stochastiques actuellement les plus performants). L’exposé sera illustré par des exemples pratiques de traitement.

Les principaux domaines d’application seront également présentés et discutés (dictée vocale, téléphonie, commandes de machines, recherche d’informations, transcription de médias, traduction parole-parole, vérification du locuteur). Nous conclurons en évoquant les aspects éthiques liés aux technologies vocales et en envisageant l’avenir de ces techniques.

Les plus récents