Grammaire de compréhension à émission de concepts Myrtille Terrier (2ème année) [email protected] CRIP5, équipe Diadex. Université René Descartes – Paris V LaLICC FRE 2919, équipe Parole et Langage. Université de Paris-Sorbonne – Paris IV Société SoNear, logiciels applicatifs pour téléphones mobiles PROBLEMATIQUE Compréhension de la parole dans des applications de dialogue vocal ETAT DE L’ART CONTRIBUTION Système de dialogue vocal 1. Système de reconnaissance Moteur de reconnaissance vocale + Modèle de langage Modèle de langage généraliste (n-gram) Estimation de la probabilité d'un mot connaissant ses N prédécesseurs 10-15% d’erreurs (Broadcast News) 40% d’erreurs (Meeting Recognition) 3. Description des connaissances linguistiques 2. Grammaire de compréhension Analyse des énoncés reconnus par le système de reconnaissance Représentation du lexique (syntaxe et sémantique lexicale) fondée sur une structuration de traits de modalité et de valeurs données Syntaxe Modèle de langage formel spécialisé Grammaire hors contexte <HC1>::= je voudrais <HC2> <HC3> <HC2>::= partir|aller <HC3>::= <HC4>|<HC5> <HC4>::= en vacances <HC5>::= de <HC6> <HC6>::= Paris|Lyon|Grenoble mode: indicatif temps: présent personne: 1ere nombre: sing 2. Conversion d’une suite de mots en chunks (patrons prédéfinis) [Je] [voudrais partir] [de Paris] mot je nature pronom 3. Construction de phrases à partir des chunks [[Je/SN [voudrais partir/SV] [de Paris/sprep]] 4. Compréhension,grâce aux concepts sémantico-pragamatiques associés à la tête lexicale du chunk (lexique du domaine de la tâche) <GC1>::= <mouvement><GC2> <mouvement>::= partir |aller <GC2>::= <localisation>|<état> <localisation>::= Paris|Lyon|Grenoble <état>::= vacances|retraite sous cat: personnel personne: 1ere nombre: sing Modèle de langage peu flexible Nombreuses règles dues à la spécialisation Faible niveau d’abstraction Sémantique lexicale lemme vouloir concept spécialisation lemme partir concept spécialisation Pas d’analyse linguistique profonde Contraintes syntaxiques formulation expressif: volonté mouvement polarité locative: initiale transitionnel: + (traitement des ellipses, anaphores, cataphores, deixis) Unification de la valeur des traits Personne et Nombre (C2) RUSynt 2 {Accord_Genre_Nombre} : article (Genre, Nombre) ∧ nom (Genre, Nombre) Contraintes entre les syntagmes (représentation simplifiée) (C3) RUSynt 3 {Phrase} : SN ∧ SV ∧ RUSynt 1 (C4) RUSynt 4 {Phrase} : SN ∧ SPrep (C5) RUSynt 5 {SV} : verbe ∧ Sprep () (C6) RUSynt 6 {Sprep} : prep ∧ SN SN: syntagme nominal SV: syntagme verbal SPrep: syntagme prépositionnel [[mouvement: partir] [localisation:Paris]] Contraintes logiques sur les traits et les valeurs Concordance des temps, traitement des accords (C1) RUSynt 1 {Accord_Personne_Nombre} : pronom (Personne, Nombre) ∧ verbe (Personne, Nombre) mot voudrais nature verbe Grammaire de syntagmes minimaux (chunks) [Abney 91] 1. Identification des mots [Je/ pronom] [voudrais/verbe] [partir/verbe] [de/prep] [Paris/nom propre] 4. Grammaire d’unification Contraintes sémantiques Contraintes entre les constituants sémantiques (sémantique relationnelle) (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: Valeur) ∧ mouvement (polarité locative: Valeur) Unification de la valeur du trait Polarité Locative (Valeur) 5. Grammaire d’unification à émission de concepts pour la compréhension Bibliographie J. Dowding, B.A. Hockey, J.M. Gawron, and C. Culy. (2001). Practical issues in compiling typed unification grammars for speech recognition. In Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics, Toulouse, France. - - R. Moore. (1998). Using natural language knowledge sources in speech recognition. In Proceedings of the NATO Advanced Studies Institute. - M. Rayner, B.A. Hockey, J.-M. Renders, N. Chatzichrisafis and K. Farrell. (2005). Spoken Language Processing in the Clarissa Procedure Browser. ICSI Tech Report TR-05-005. 6. Modalité d’évaluation Taux d’erreur de reconnaissance - en mots: 2,02% - en concepts Une contrainte satisfaite peut émettre un ou plusieurs nouveau(x) concept(s) (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: finale) ∧ mouvement (polarité locative: finale) Émission nouveau concept: trajet [localisation[cible]] (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: initiale) ∧ mouvement (polarité locative: initiale) Émission nouveau concept: trajet [localisation[source]] Couverture de la langue Taux de réutilisation des contraintes - syntaxiques - sémantiques Ex: (C3) ∧ (C4) ∧ (C7) Il peut arriver à Autran ? Je veux revenir à l’hôtel le plus tôt possible Un billet au départ de la gare de Lyon, s’il vous plait Demain, je partirai de la place Grenette Ils vont décoller de Lyon à midi je vais partir de l’aile nord de l’aéroport RCG Approche flexible Réutilisation des connaissances syntaxiques et sémantiques Description hiérarchique Grammaire formelle de reconnaissance et de compréhension pour le dialogue Une grammaire d’unification pour modéliser la réponse de l’utilisateur à 1 question Perspective: génération automatique de grammaires d’unification spécialisées [Rayner 05] École d’été Dialogue et Interaction- Juillet 2006- Autran Génération d’une grammaire hors contexte de reconnaissance à partir de cette grammaire [Moore 98][Dowding 01]