Back to Search Start Over

Inversion acoustique-articulatoire avec contraintes

Authors :
Potard, Blaise
Laprie, Yves
Analysis, perception and recognition of speech (PAROLE)
INRIA Lorraine
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
Institut National de Recherche en Informatique et en Automatique (Inria)-Université Henri Poincaré - Nancy 1 (UHP)-Université Nancy 2-Institut National Polytechnique de Lorraine (INPL)-Centre National de la Recherche Scientifique (CNRS)-Université Henri Poincaré - Nancy 1 (UHP)-Université Nancy 2-Institut National Polytechnique de Lorraine (INPL)-Centre National de la Recherche Scientifique (CNRS)
Université Henri Poincaré - Nancy 1
Yves Laprie
Source :
Interface homme-machine [cs.HC]. Université Henri Poincaré-Nancy 1, 2008. Français. ⟨NNT : 2008NAN10085⟩
Publication Year :
2008
Publisher :
HAL CCSD, 2008.

Abstract

This thesis investigates acoustic-to-articu1atory inversion, i.e. recovering articulatory movements from the speech signal. In this work, we present an important evolution of codebooks methods, i.e. methods using acoustic-articulatory tuples precomputed using an acoustic synthesis model. Apart from the inversion method, we present the introduction of two types of constraints: generic phonetic constraints, derived from the analysis by human experts of articulatory invariance for vowels, and visual constraints, i.e. constraints derived automatically from a video signal, in our case a stereo video signal, thus allowing us to perform multimodal inversion.<br />Cette thèse porte sur l'ínversion acoustique-articulatoire, c'est-à-dire la récupération des mouvements des articulateurs de la parole à partir du signal sonore. Nous présentons dans ce mémoire une évolution importante des méthodes de tabulation à codebooks utilisant une table de correspondants acoustique-articulatoire précalculée à l'aide d'un modèle de synthèse acoustique. En dehors de la méthode d'inversion proprement dite, nous présentons également l'introduction de deux types de contraintes : des contraintes phonétiques génériques, issues de l'analyse par des experts humains de l'invariance articulatoire des voyelles, et des contraintes visuelles, c'est-à-dire des contraintes obtenues automatiquement à partir de l'enregistrement et l'analyse d'images en stéréovision du locuteur.

Details

Language :
French
Database :
OpenAIRE
Journal :
Interface homme-machine [cs.HC]. Université Henri Poincaré-Nancy 1, 2008. Français. ⟨NNT : 2008NAN10085⟩
Accession number :
edsair.dedup.wf.001..17005b6a284198a1b99efba0360fc378