1
Cours parole du 9 février 2005
enseignants: Dr. Dijana Petrovska-Delacrétaz
et Gérard Chollet
Reconnaissance Automatique de la Parole
1. Introduction, Historique, Domaines d’applications
2. Extraction de paramètres
3. Comparaison de représentations temps-fréquence
4. DTW : Dynamic Time Warping (anamorphose T-F)
5. Modèles stochastiques (HMM, Réseaux Bayésiens)
6. Modèles de langage
7. Evaluation
8. Conclusions
2
1. Introduction à la
Reconnaissance Automatique de la Parole
Reconnaissance Automatique de la Parole = processus qui associe
un signal de parole à une forme d’action (transcription, commande,
« compréhension »,)
Commande = le signal de parole déclenche une action (vocabulaire
limité)
Dictée vocale = tâche de transcription orthographique (vocabulaire
illimité !?)
« Compréhension » et dialogue = la machine devrait se comporter
comme un humain (test de Turing : http://fr.wikipedia.org/wiki/Test_de_Turing).
3
Histoire de la
Reconnaissance Automatique de la Parole
4
Dimensions et difficultés en RAP
Taille du vocabulaire, perplexité, facteur de branchement,
Environnement sonore (prise de son), distortions, pertes,
bande passante (téléphonique, élargie, HiFi,)
Nombre de locuteurs concernés, motivation des locuteurs,
Possibilités d’apprentissage, d’adaptation,
Nombre de langues, accents,
Ergonomie de l’interface vocale,
5
1 / 67 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !