République Algérienne Démocratique et Populaire
ﻲــــﻤــﻠـﻌﻟا ﺚــــﺤــﺒـﻟا و ﻲــــــــﻟﺎــﻌﻟا ﻢـــﻴـــﻠــﻌﺘﻟا ةرازو
Ministère de l’Enseignement Supérieur et de la Recherche Scientifique
UNIVERSITE DES SCIENCES ET DE LA TECHNOLOGIE D’ORAN Mohamed Boudiaf
Faculté des Sciences
Département d’Informatique
Spécialité : Informatique Option : Reconnaissance des Formes et Intelligence
Artificielle (RFIA)
MEMOIRE
Présenté par
Mme AZIB Lamia
Pour l’obtenir du diplôme de Magister en Informatique
Thème :
SOUTENU LE 03/07/ 2012 à 14H00 dans la salle de soutenance
Devant la commission d’examen composée de :
Qualité Nom et Prénom Grade Etb d’origine
Président BENYETTOU Mohamed Professeur USTO
Rapporteur BENYETTOU Abdelkader Professeur USTO
Examinatrice BENAMRANE Nacéra M.conf. A USTO
Examinatrice IZABATENE-FIZAZI Hadria M.conf. A USTO
Le public est cordialement invité
Année universitaire : 2011/2012
Application des Modèles de Markov Cachés et les Modèles de Mélanges de
Gaussiennes pour la Classification Phonétique
RESUME
Les recherches en ingénierie d’informatique et de la communication ont pour
objectifs de faciliter la coopération homme-machine au travers des systèmes
interactifs conversationnels robustes pour le grand public. Ces objectifs nécessitent
de comprendre le fonctionnement et de tester l’efficacité d’un certain nombre
d’algorithmes de classifications actuellement utilisés.
Les méthodes stochastiques basées sur les Modèles de Mélanges de Gaussiennes
(GMM) et les Modèles de Markov Cachés (HMM) ont été pleinement exploités pour
des systèmes de reconnaissance du langage parlé, mais aussi dans bien d’autres
applications dans lesquelles apparaît une séquentialité.
Le travail de ce magister s’inscrit dans la perspective d'implémenter un système
interactif ayant pour but de classifier les phonèmes. Ce système exploite les
propriétés de la modélisation liées aux GMM ainsi qu’aux HMM pour une tâche de
classification au quel est intégré des composantes présentant mieux l’information
temporelle dans le signal de la parole.
Mots-clés : Modèle de Mélange de Gaussiennes (GMM), Modèle de Markov Caché
(HMM).
ABSTRACT
Search in engineering of data processing and the communication have for
objectives to facilitate the man-machine cooperation through robust conversational
interactive systems for general public. These objectives require to understand the
operation and to test the effectiveness of a certain number of classifications algorithms
currently used.
The stochastic methods based on the Gaussian Mixture Models (GMM) and
Hidden Markov Models (HMM) were fully exploited for systems of recognition of the
spoken language, but also in good of other applications in which a sequentiality
appears.
The work of this magister falls under the prospect to implement an interactive
system having for goal to classify the phonemes. This system exploits the properties of
modeling related to GMM as well to HMM for a task of classification into which is
integrated components presenting better temporal information in the speech signal.
Key-words: Gaussian Mixture Model (GMM), Hidden Markov Model (HMM).
REMERCIEMENTS
Je remercie « DIEU »
pour m’avoir guidé et aidé à terminer ce mémoire
Avec beaucoup de gratitude et de sincérité, je remercie vivement le rapporteur de ce
mémoire le Professeur Mr BENYETTOU Abdelkader pour sa présence scientifique et
humaine ainsi que pour tout le soin qu’il apporte à nous diriger vers des sujets d’actualité.
Je remercie également le Professeur Mr BENYETTOU Mohamed, pour avoir accepté
de présider le jury. Qu’il trouve ici l’expression de mon profond respect.
Mes remerciements s’adressent au même titre aux Maîtres de Conférences Melle
BENAMRANE Nacéra et Mme IZABATENE-FIZAZI Hadria pour l’intérêt qu’ils ont
porté à notre travail et d’avoir accepter de l’examiner.
Finalement, je remercie toute personne ayant contribué de près ou de loin à
l’accomplissement de ce travail.
DEDICACES
Ce mémoire est dédié à toutes celles et à tous ceux qui ont contribué
de près ou de loin, directement ou indirectement,
à son existence ; en particulier :
à mes très chers parents qui ont été toujours là pour me soutenir et
m’encourager, que Dieu les garde pour moi
et guérie mon très cher père
à mon époux…
à mes frères et sœurs
à ma belle famille
à tous les gens que j’aime
INTRODUCTION GENERALE 01
CHAPITRE I GENERALITE SUR LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
I.1 Introduction 03
I.2 Historique de la reconnaissance de la parole 03
I.3 Principe de la reconnaissance automatique de la parole 05
I.3.1 Phase de paramétrisation du signal de parole 06
I.3.2 Phase de modélisation 08
I.3.3 Phase d’apprentissage 09
I.3.4 Phase de reconnaissance 10
I.4 Méthodologies de reconnaissance 10
I.4.1 Approche analytique 10
I.4.2 Approche globale 11
I.5 Approches appliquées à la RAP 12
I.5.1 Approche statistique 12
I.5.2 Approche neuronale 13
I.6 Protocoles de test 14
I.7 Conclusion 14
CHAPITRE II MODELE DE MELANGE DE GAUSSIENNES
II.1 Introduction 15
II.2 Rappels probabilistes 15
II.2.1 Principe de la décision bayesienne 15
II.2.2 Règle de Bayes 16
II.2.3 Estimation au maximum de vraisemblance 16
II.2.4 Loi normale 17
II.2.5 Loi normale multidimensionnelle 17
II.2.6 Mélange de lois 18
1 / 110 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !