Rapport

2548 mots 11 pages
Interface multimodale

Rapport Travail pratique

Logiciel de reconnaissance vocale Sphinx-4

Philippe Galley, Blaise Grand & Samuel Rossier

19 mai 2006

1

Table des matières
1 Introduction 2 Informations générales sur Sphinx-4 2.1 2.2 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Présentation de Sphinx-4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 2.2.2 Fonctionnement de la reconnaissance vocale . . . . . . . . . . . . . . . . . Architecture de Sphinx-4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 1 2 2 3 3 3 6 6 7 7 8 8 8 8

3 Installation 3.1 3.2 Logiciels requis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Implémentation de la librairie avec Eclipse . . . . . . . . . . . . . . . . . . . . . .

4 Application Tank Speech 4.1 4.2 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Implémentation de la reconnaissance vocale . . . . . . . . . . . . . . . . . . . . . 4.2.1 4.2.2 4.2.3 4.3 Code Java pour l’implémentation de la reconnaissance vocale . . . . . . . Fichier de grammaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fichier de configuration . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5 Conclusion

Interface multimodale

1

Introduction

La reconnaissance vocale est une technologie informatique permettant à un logiciel d’interpréter une langue naturelle humaine. Le principe est simple : un enregistrement de quelques mots prononcés par un locuteur est interprété en texte. Cela permet entre autres la transcription automatique et le contrôle de systèmes par la voix. Cette technologie utilise des méthodes informatiques des domaines du traitement du signal et de l’intelligence artificielle. Une phrase enregistrée et numérisée est donnée au programme de

en relation