Acquisition automatique de
«morphèmes acoustiques» pour
la compréhension langagière
en collaboration avec
Allen Gorin
Giuseppe Riccardi
Jerry Wright
2
Introduction
Notre objectif => dialoguer en langage spontané avec des machines
Méthodes actuelles =>
besoin des corpus de parole annotés manuellement
Inconvénients => nouvelle application, collecte et annotation de
nouvelles bases de données
Objectif => développer des méthodes d’apprentissage automatique
du vocabulaire, de la grammaire et de la sémantique à partir de
corpus de parole sans transcriptions
Tâche difficile => commencer avec un reconnaisseur phonétique
(dépendant de la langue)
Evaluation => l’utilité de unités apprises automatiquement, évaluée
lors de la classification d’appels téléphoniques dans la tâche « How
May I Help You ?», développée à AT&T
3
Plan
1Etat de l’art
2Base de données
3Acquisition automatique de
« morphèmes acoustiques » et
leur caractérisation
4Détection de ces morphèmes
5Evaluation expérimentale =>
classification de requêtes téléphoniques
6Conclusions et perspectives
4
1 Etat de l’art
Olivier (1968 ) : acquisition automatique de mots et de la grammaire
à partir du texte sans les délimiteurs de mots
Gorin, Levinson et Sankar (1994) : acquisition des unités lexicales à
partir d’un flux de mots isolés
Deligne et Bimbot - 1997;
Llyod-Thomas, Parris, Wright -1998 et
Chollet, Cernocky, Constantinescu, Deligne, Bimbot -1999
acquisition automatique de séquences d’unités de longueur variable
dans de la parole continue
Notre but :
exploiter la parole et sa signification pour
la compréhension du langage en minimisant l’utilisation des
transcriptions
5
Base de données utilisée
Corpus « How may I help you ?» HMIHY
transactions téléphoniques classées par type d’appel
(appel <=> action): 7462 apprentissage et 1000 test
Reconnaisseur phonétique indépendant de la tâche :
Modèle de langage phono-tactique de Switchboard 1
(Automate Stochastique de multigrammes, max 6)
Résultats sur HMIHY : 44% de phones reconnus correctement
dans le meilleur chemin, et 68% dans le treillis phonétique
ASR-phone-train et ASR-phone-test
1 / 24 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !