Rehaussement et reconnaissance robuste de la parole

Conférence Recherche
le  10 novembre 2017Saint-Martin-d'Hères - Domaine universitaire
Conférence organisée dans le cadre de la spécialisation aux "Industries de la Langue".
Le rehaussement de la parole consiste à traiter un signal de parole de sorte à réduire le bruit, la réverbération et l'écho et à conserver la voix du locuteur désiré. C'est une technologie présente dans un nombre croissant de produits : aides auditives, téléphones mains-libres, assistants vocaux (voiture, télévision, enceintes connectées), logiciels d'édition multimédia...

La résolution de ce problème fait appel au traitement du signal et à l'apprentissage automatique. Il s'agit de modéliser les propriétés spatiales et spectrales des sources sonores au cours du temps, d'estimer les paramètres de ces modèles à partir des signaux enregistrés, et d'en déduire un filtre multicanal variant au cours du temps qui supprime les signaux non désirés.

L'usage du rehaussement comme prétraitement pour la reconnaissance robuste de la parole et l'exploitation de la distorsion résiduelle du signal de parole dans le système de reconnaissance par le paradigme dit de "propagation de l'incertitude" sera également abordé.

Intervenant


Emmanuel Vincent, équipe Multispeech, Inria Nancy - Grand Est / Loria UMR 7503.
Publié le  6 novembre 2017
Mis à jour le  6 novembre 2017