Le traitement automatique de la parole Comment reproduire les

publicité
Reconnaissance de la parole
Ivan Magrin-Chagnolleau, CNRS
Laboratoire Dynamique Du Langage
[email protected]
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
1
Objectifs
Transformer un signal de parole en :
• Texte (dictée vocale, transcription)
• Action (commande vocale, systèmes de
dialogue)
• Information indexée (annotation,
indexation)
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
2
Les sources de variabilité
• Les facteurs intra-locuteurs :
co-articulation, variation dans la
prononciation, etc.
• Les facteurs inter-locuteurs :
physiologie, age, sexe, psychologie,
familiarité avec l’application, etc.
• L’environnement :
bruit, micro, canal de transmission,
présence d’autres locuteurs, etc.
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
3
Variabilité intra- et inter-locuteur
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
4
Variabilité intra-locuteur
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
5
Typologie des systèmes
• Type de parole
• Taille du vocabulaire
• Niveau de dépendance par rapport aux
locuteurs
• Environnement d’utilisation
• Profil des utilisateurs potentiels
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
6
Type de parole
•
•
•
•
•
•
Mots isolés
Mots connectés
Détection de mots clés
Parole contrainte
Parole continue
Parole spontanée
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
7
Taille du vocabulaire
•
•
•
•
•
Quelques mots (5 – 50)
Petit vocabulaire (50 – 500)
Vocabulaire moyen (500 – 5000)
Grand vocabulaire (5000 – 50000)
Très grand vocabulaire (> 50000)
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
8
Dépendance au locuteur
• Dépendant du locuteur :
le système fonctionne correctement avec
un utilisateur particulier
Adaptation au locuteur =
utilise quelques données spécifiques
d’un locuteur pour adapter le système
à une nouvelle voix
• Indépendant du locuteur :
le système fonctionne avec n’importe quel
utilisateur
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
9
Environnement d’utilisation
• Parole large-bande
(ordinateur, etc.)
• Environnement
calme (bureau +
micro-casque)
• Parole bande-étroite • Bruit de fond
avec distorsion
(téléphone, etc.)
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
10
Profil des utilisateurs potentiels
• Utilisation
professionnelle par
des spécialistes
• Entraîné / naïf
• Grand public
• Utilité
• Fréquent /
occasionnel
• Coopération
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
11
Deux exemples
Dictée vocale
Service téléphonique
• Parole continue
•
•
•
•
• Détection de mots
clés
Grand vocabulaire
• Quelques mots
Adaptation au locuteur • Indépendant du
locuteur
Bureau+micro-casque • Parole téléphonique
Utilisateurs
• Grand public
d’ordinateurs
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
12
Système de reconnaissance de mots
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
13
Programmation dynamique (DTW)
Mot 1
Mot inconnu Y
Mot X
Mot 2
Mot n
 (X, Y)   d 2 (xi , y j )
meilleur
chemin
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
14
Contraintes locales
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
15
Contraintes locales : exemple
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
16
Modèle de Markov caché : principe
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
17
Modèles de Markov cachés (HMM)
Mot inconnu Y
Mot 1
Mot X
Mot 2
Mot n
 (X, Y)   log P(y j SX )
i
meilleur
chemin
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
18
Viterbi : exemple
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
19
Algorithme de Viterbi : exercice
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
20
Le modèle hiérarchique
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
21
Le modèle hiérarchique : exemple
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
22
Modèles phonétiques (1)
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
23
Modèles phonétiques (2)
Le mot « américain »
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
24
Modèles contextuels
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
25
Modèles de langage
• A un instant donné, tous les mots n’ont
pas la même probabilité de présence :
– Le petit chat boit du …
• Grammaires probabilistes : toutes les
phrases sont possibles mais avec des
probabilités différentes
• Grammaires à états finis : partition binaire
des séquences de mots en « séquences
possibles » et « séquences impossibles »
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
26
Modèle acoustique + Modèle de langage
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
27
Les n meilleures phrases
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
28
Treillis de mots / Graphe de mots
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
29
Graphe de mots (2)
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
30
Performances
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
31
Recherche actuelle
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
32
Téléchargement