Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage [email protected] LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Objectifs Transformer un signal de parole en : • Texte (dictée vocale, transcription) • Action (commande vocale, systèmes de dialogue) • Information indexée (annotation, indexation) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 2 Les sources de variabilité • Les facteurs intra-locuteurs : co-articulation, variation dans la prononciation, etc. • Les facteurs inter-locuteurs : physiologie, age, sexe, psychologie, familiarité avec l’application, etc. • L’environnement : bruit, micro, canal de transmission, présence d’autres locuteurs, etc. LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 3 Variabilité intra- et inter-locuteur LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 4 Variabilité intra-locuteur LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 5 Typologie des systèmes • Type de parole • Taille du vocabulaire • Niveau de dépendance par rapport aux locuteurs • Environnement d’utilisation • Profil des utilisateurs potentiels LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 6 Type de parole • • • • • • Mots isolés Mots connectés Détection de mots clés Parole contrainte Parole continue Parole spontanée LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 7 Taille du vocabulaire • • • • • Quelques mots (5 – 50) Petit vocabulaire (50 – 500) Vocabulaire moyen (500 – 5000) Grand vocabulaire (5000 – 50000) Très grand vocabulaire (> 50000) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 8 Dépendance au locuteur • Dépendant du locuteur : le système fonctionne correctement avec un utilisateur particulier Adaptation au locuteur = utilise quelques données spécifiques d’un locuteur pour adapter le système à une nouvelle voix • Indépendant du locuteur : le système fonctionne avec n’importe quel utilisateur LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 9 Environnement d’utilisation • Parole large-bande (ordinateur, etc.) • Environnement calme (bureau + micro-casque) • Parole bande-étroite • Bruit de fond avec distorsion (téléphone, etc.) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 10 Profil des utilisateurs potentiels • Utilisation professionnelle par des spécialistes • Entraîné / naïf • Grand public • Utilité • Fréquent / occasionnel • Coopération LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 11 Deux exemples Dictée vocale Service téléphonique • Parole continue • • • • • Détection de mots clés Grand vocabulaire • Quelques mots Adaptation au locuteur • Indépendant du locuteur Bureau+micro-casque • Parole téléphonique Utilisateurs • Grand public d’ordinateurs LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 12 Système de reconnaissance de mots LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 13 Programmation dynamique (DTW) Mot 1 Mot inconnu Y Mot X Mot 2 Mot n (X, Y) d 2 (xi , y j ) meilleur chemin LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 14 Contraintes locales LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 15 Contraintes locales : exemple LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 16 Modèle de Markov caché : principe LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 17 Modèles de Markov cachés (HMM) Mot inconnu Y Mot 1 Mot X Mot 2 Mot n (X, Y) log P(y j SX ) i meilleur chemin LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 18 Viterbi : exemple LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 19 Algorithme de Viterbi : exercice LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 20 Le modèle hiérarchique LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 21 Le modèle hiérarchique : exemple LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 22 Modèles phonétiques (1) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 23 Modèles phonétiques (2) Le mot « américain » LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 24 Modèles contextuels LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 25 Modèles de langage • A un instant donné, tous les mots n’ont pas la même probabilité de présence : – Le petit chat boit du … • Grammaires probabilistes : toutes les phrases sont possibles mais avec des probabilités différentes • Grammaires à états finis : partition binaire des séquences de mots en « séquences possibles » et « séquences impossibles » LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 26 Modèle acoustique + Modèle de langage LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 27 Les n meilleures phrases LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 28 Treillis de mots / Graphe de mots LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 29 Graphe de mots (2) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 30 Performances LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 31 Recherche actuelle LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 32