Reconnaissance vocale

26242 mots 105 pages
Ecole Polytechnique, Promotion X 97

Rapport de Stage d’Option scientifique

Vincent ARSIGNY

Modélisation par champ de Markov du signal de parole et application à la reconnaissance vocale.

Option Image et Signal Département de Mathématiques appliquées Directeurs de l’Option : MM Stéphane MALLAT et Emmanuel BACRY

Stage effectué à l’Ecole Nationale Supérieure des Télécommunications de Paris, sous la direction de MM Marc SIGELLE et Guillaume GRAVIER, du 1er avril 2000 au 7 juillet 2000

Table des matières
1 Le problème général de la reconnaissance de la parole 1.1 La paramétrisation du signal de parole . . . . . . . 1.2 Une modélisation par processus cachés . . . . . . . 1.3 Le principe du maximum de vraissemblance . . . . 1.4 Expression du score acoustique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 7 8 9 9 12 15 20 20 22 28 32 32 35 37 39 39 41 43 46 46 47 49 52 53 53 57 gradient . . . . . gradient . . . . . stochastique, . . . . . . . . stochastique, . . . . . . . . 57 59

2 Un premier modèle de processus caché : les chaînes de Markov 2.1 Les HMM, un outil classique . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Modèle gauche-droite dans un espace contraint . . . . . . . . . . . . . . 2.3 Calculs dans l’espace contraint uniforme . . . . . . . . . . . . . . . . . . 3 Les champs de Markov : un outil pour la modélisation multibande du signal de parole 3.1 Les origines des champs de Markov en Physique Statistique . . . . . . . 3.2 Définition et propriétés générales . . . . . . . . . . . . . . . . . . . . . . 3.3 Application à la modélisation de la parole . . . . . . . . . . . . . . . . . 4 L’apprentissage des paramètres du modèle 4.1 Résolution par maximum de vraissemblance . . . . . . . . . . . . . . . . 4.2 Algorithme EM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Une initialisation possible pour un potentiel de synchronisation quadratique 5 La

en relation