Représentation informatique de grammaires fortement lexicalisées

Représentation informatique de grammaires fortement
lexicalisées
Application à la grammaire d’arbres adjoints
Institut Gaspard Monge
Benoit Crabbé
Lattice — Université Paris 7
Représentation de grammaires fortement lexicalisées 1
Prégénérique
Implémentation de grammaires électroniques de taille importante pour le
langage naturel
Grammaires motivées linguistiquement
On focalise sur l’implémentation de grammaires d’arbres adjoints
augmentées d’une composante sémantique
On donne un langage et une méthodologie qui permettent de faciliter
l’implémentation effective de grammaires de ce type
Le langage et la méthodologie sont validés par l’implémentation d’une
grammaire de compétence couvrant un fragment important du français
Représentation de grammaires fortement lexicalisées 2
Plan
Introduction
Désidératas et motivations
Partage de structure/Alternatives
Un langage de représentation
Langage de contrôle/Langage de description arborescentes
Méthodologie
Langage !Partage de structure / alternatives
Comparaisons
Métarègles Candito Xia
Validation :
Implantation d’une grammaire/évaluation
Conclusion
Représentation de grammaires fortement lexicalisées 3
The big picture
Problème général : implémentation de formalismes d’analyse
syntaxiques de haut niveau (grammaire de compétence)
Formalisme de bas niveau : bonnes propriétés formelles et
informatiques mais expressivité réduite :
Exemples : CFG, DCG, TAG...
Formalisme de haut niveau : propriétés formelles et informatiques
moins bonnes (moins bien connues) mais grand pouvoir d’expressivité
Exemples : PATR II, ANLT (GPSG), TDL (HPSG), métagrammaire . . .
Idée : compilation (=traduction) automatique du langage de haut niveau
dans le langage de bas niveau.
Représentation de grammaires fortement lexicalisées 4
Exemple classique (GPSG/ANLT)
Implémentation ANLT de (Carroll 93)
Langage de bas niveau = grammaire CF + unication à traits atomiques
dont les symboles sont codés sur des entiers
Langage de haut niveau = ANLT, permet par exemple d’exprimer :
Propagation de traits de tête, de traits de valence, de slash
(dépendances à longue distance)
Métarègles (alternances actif/passif)
Le parsing pour le langage de bas niveau s’implémente avec un
algorithme classique
Les propriétés informatiques du langage de haut niveau sont mauvaises
(indécidable, métarègles = machine de Turing)
Représentation de grammaires fortement lexicalisées 5
1 / 47 100%

Représentation informatique de grammaires fortement lexicalisées

La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !