6. Modalité d`évaluation

publicité
Grammaire de compréhension à émission de concepts
Myrtille Terrier (2ème année)
[email protected]
CRIP5, équipe Diadex. Université René Descartes – Paris V
LaLICC FRE 2919, équipe Parole et Langage. Université de Paris-Sorbonne – Paris IV
Société SoNear, logiciels applicatifs pour téléphones mobiles
PROBLEMATIQUE
Compréhension de la parole dans des applications de dialogue vocal
ETAT DE L’ART
CONTRIBUTION
Système de dialogue vocal
1. Système de reconnaissance
Moteur de reconnaissance vocale
+
Modèle de langage
 Modèle de langage généraliste (n-gram)
Estimation de la probabilité d'un mot connaissant
ses N prédécesseurs
 10-15% d’erreurs (Broadcast News)
 40% d’erreurs (Meeting Recognition)
3. Description des connaissances
linguistiques
2. Grammaire de compréhension
Analyse des énoncés reconnus
par le système de reconnaissance
Représentation du lexique (syntaxe et sémantique lexicale)
fondée sur une structuration de traits de modalité et de valeurs
données
 Syntaxe
 Modèle de langage formel spécialisé
Grammaire hors contexte
<HC1>::= je voudrais <HC2> <HC3>
<HC2>::= partir|aller
<HC3>::= <HC4>|<HC5>
<HC4>::= en vacances
<HC5>::= de <HC6>
<HC6>::= Paris|Lyon|Grenoble
mode: indicatif
temps: présent
personne: 1ere
nombre: sing
2. Conversion d’une suite de mots en chunks (patrons prédéfinis)
[Je] [voudrais partir] [de Paris]
mot je
nature pronom
3. Construction de phrases à partir des chunks
[[Je/SN [voudrais partir/SV] [de Paris/sprep]]
4. Compréhension,grâce aux concepts sémantico-pragamatiques
associés à la tête lexicale du chunk (lexique du domaine de la
tâche)
<GC1>::= <mouvement><GC2>
<mouvement>::= partir |aller
<GC2>::= <localisation>|<état>
<localisation>::= Paris|Lyon|Grenoble
<état>::= vacances|retraite
sous cat: personnel
personne: 1ere
nombre: sing
Modèle de langage peu flexible
Nombreuses règles dues à la spécialisation
Faible niveau d’abstraction
 Sémantique lexicale
lemme vouloir
concept
spécialisation
lemme partir
concept
spécialisation
 Pas d’analyse linguistique profonde
 Contraintes syntaxiques
formulation
expressif: volonté
mouvement
polarité locative: initiale
transitionnel: +
(traitement des ellipses, anaphores, cataphores, deixis)
Unification de la valeur des traits Personne et Nombre
(C2) RUSynt 2 {Accord_Genre_Nombre} :
article (Genre, Nombre) ∧ nom (Genre, Nombre)
Contraintes entre les syntagmes (représentation simplifiée)
(C3) RUSynt 3 {Phrase} : SN ∧ SV ∧ RUSynt 1
(C4) RUSynt 4 {Phrase} : SN ∧ SPrep
(C5) RUSynt 5 {SV} : verbe ∧ Sprep ()
(C6) RUSynt 6 {Sprep} : prep ∧ SN
SN: syntagme nominal
SV: syntagme verbal
SPrep: syntagme prépositionnel
 [[mouvement: partir] [localisation:Paris]]

Contraintes logiques sur les traits et les valeurs
Concordance des temps, traitement des accords
(C1) RUSynt 1 {Accord_Personne_Nombre} :
pronom (Personne, Nombre) ∧ verbe (Personne, Nombre)
mot voudrais
nature verbe
Grammaire de syntagmes minimaux (chunks) [Abney 91]
1. Identification des mots
[Je/ pronom] [voudrais/verbe] [partir/verbe] [de/prep]
[Paris/nom propre]
4. Grammaire d’unification
 Contraintes sémantiques
Contraintes entre les constituants sémantiques (sémantique
relationnelle)
(C7) RUSem 1 {Trajet_Partiel}:
mouvement (polarité locative: Valeur)
∧
mouvement (polarité locative: Valeur)
Unification de la valeur du trait Polarité Locative (Valeur)
5. Grammaire d’unification à émission de concepts pour la compréhension
Bibliographie
J. Dowding, B.A. Hockey, J.M. Gawron, and C. Culy. (2001).
Practical issues in compiling typed unification grammars for
speech recognition. In Proceedings of the 39th Annual Meeting
of the Association for Computational Linguistics, Toulouse,
France.
-
- R. Moore. (1998). Using natural language knowledge sources
in speech recognition. In Proceedings of the NATO Advanced
Studies Institute.
- M. Rayner, B.A. Hockey, J.-M. Renders, N. Chatzichrisafis and
K. Farrell. (2005). Spoken Language Processing in the Clarissa
Procedure Browser. ICSI Tech Report TR-05-005.
6. Modalité d’évaluation
 Taux d’erreur de reconnaissance
- en mots: 2,02%
- en concepts
Une contrainte satisfaite peut émettre un ou plusieurs
nouveau(x) concept(s)
(C7) RUSem 1 {Trajet_Partiel}:
mouvement (polarité locative: finale)
∧
mouvement (polarité locative: finale)
Émission nouveau concept: trajet [localisation[cible]]
(C7) RUSem 1 {Trajet_Partiel}:
mouvement (polarité locative: initiale)
∧
mouvement (polarité locative: initiale)
Émission nouveau concept: trajet [localisation[source]]
 Couverture de la langue
Taux de réutilisation des contraintes
- syntaxiques
- sémantiques
Ex: (C3) ∧ (C4) ∧ (C7)
Il peut arriver à Autran ?
Je veux revenir à l’hôtel le plus tôt possible
Un billet au départ de la gare de Lyon, s’il vous plait
Demain, je partirai de la place Grenette
Ils vont décoller de Lyon à midi
je vais partir de l’aile nord de l’aéroport RCG
 Approche flexible
Réutilisation des connaissances syntaxiques et
sémantiques
Description hiérarchique
Grammaire formelle de reconnaissance et de compréhension pour le dialogue
 Une grammaire d’unification pour modéliser la réponse de
l’utilisateur à 1 question

Perspective: génération automatique de grammaires
d’unification spécialisées [Rayner 05]
École d’été Dialogue et Interaction- Juillet 2006- Autran
Génération d’une grammaire hors contexte de reconnaissance
à partir de cette grammaire [Moore 98][Dowding 01]
Téléchargement