Université Paris 7
UFR de Linguistique
TaLaNa
Organisation modulaire et paramétrable de
grammaires électroniques lexicalisées
Application au français et à l'italien
Marie-Hélène Candito
Thèse de Doctorat
de Linguistique Théorique, Formelle et Automatique
soutenue le 26 janvier 1999
Directrice : Anne Abeillé
Jury : Roberto Basili
Laurence Danlos
Aravind Joshi
Philip Miller (Rapporteur)
Eric Wehrli (Rapporteur)
Remerciements
J'ai passé plusieurs années à préparer cette thèse (!). Ces années ont été riches, en
rencontres, en discussions, sur la linguistique, l'informatique, et bien sûr, sur le lien
entre les deux disciplines...
Je remercie énormément Anne Abeillé, ma directrice, pour son enthousiasme,
ses compétences, sa rigueur. Son aide constante et son énergie ont été essentielles à mon
travail. Merci beaucoup.
Je voudrais remercier chaleureusement Sylvain Kahane, pour avoir bien voulu
collaborer avec moi. Une partie de cette thèse est le résultat d'un travail commun, sur la
jonction entre les grammaires d'arbres adjoints et les grammaires de dépendances, et en
particulier la Théorie Sens-Texte.
Je remercie sincèrement Laurence Danlos, pour la création et la direction de
TaLaNa, laboratoire vivant, plein d'énergies diverses et variées : les membres de
TaLaNa, que je suis heureuse de connaître.
Merci beaucoup également à Benoît Robichaud, pour avoir mis en place la
procédure d'évaluation de la grammaire sur le corpus TSNLP, et à Bangalore Srinivas
pour ses heures non comptées de travail, à mettre en place le système XTAG à TaLaNa.
Je remercie enfin les membres du jury, et tout particulièrement mes rapporteurs
Philip Miller et Eric Wehrli, d'avoir bien voulu relire attentivement mon travail, dans
des délais assez courts! Merci de votre patience.
Merci à Benjamin pour son soutien sans faille...
Sommaire
INTRODUCTION
...........................................................................................................................1
PARTIE 1 MOTIVATIONS PRATIQUES ET AMBITION THEORIQUE
POUR LA METAGRAMMAIRE
.................................................................. 5
CHAPITRE 1 LES GRAMMAIRES LEXICALISEES D'ARBRES ADJOINTS :
UNE INTRODUCTION
.......................................................................................
7
1. RAPPELS SUR LE FORMALISME.................................................................................................... 7
1.1 P
ROCEDURE DE DERIVATION ASSOCIEE AUX
TAG..............................................................................8
1.2 L
ES TRAITS ASSOCIES AUX ARBRES ELEMENTAIRES
.......................................................................... 12
2. TAG ET LINGUISTIQUE................................................................................................................... 15
2.1 TAG
EST UN FORMALISME MATHEMATIQUE
,
UTILE EN LINGUISTIQUE
. .............................................15
2.1.1 TAG est un formalisme mathématique contraint .....................................................................15
2.1.2 L'opération d'adjonction permet un domaine de localité étendu, et en particulier la
lexicalisation.....................................................................................................................................16
2.2 L
ES PRINCIPES LINGUISTIQUES ASSOCIES AUX
TAG.......................................................................... 17
2.3 TAG
ET QUELQUES THEORIES SYNTAXIQUES
....................................................................................20
2.4 TAG
ET INTERPRETATION SEMANTIQUE
...........................................................................................22
2.4.1 Une version sémantique du Principe de Cooccurrence Prédicat-Arguments.......................... 23
3. L'ORGANISATION INTERNE D'UNE LTAG : MOTIVATIONS POUR UN NIVEAU
SUPPLEMENTAIRE DE REPRESENTATION................................................................................... 27
3.1 O
RGANISATION PRATIQUE D
'
UNE
LTAG :
EXEMPLE DU SYSTEME
XTAG......................................... 28
3.2 M
OTIVATIONS POUR UN NIVEAU SUPPLEMENTAIRE DE DESCRIPTION
................................................ 30
3.2.1 Solutions existantes pour la représentation compacte d'une LTAG......................................... 31
CHAPITRE 2 LA METAGRAMMAIRE
...................................................................................33
1. LA STRUCTURATION DES CONNAISSANCES LINGUISTIQUES DANS LA MG................. 34
1.1 L
A SOUS
-
CATEGORISATION EN TERMES DE FONCTIONS GRAMMATICALES
.........................................35
1.2 L
A DISTINCTION DE FONCTIONS GRAMMATICALES INITIALES
.............................................................38
1.2.1 Les redistributions des FG.......................................................................................................39
1.3 L
ES REALISATIONS DES FONCTIONS GRAMMATICALES
...................................................................... 41
1.4 L
ES DIFFERENTS DOMAINES D
'
INFORMATION DE LA
MG ................................................................... 41
1.5 J
USTIFICATION DES DOMAINES D
'
INFORMATION RETENUS
................................................................. 42
1.5.1 Pour la notion de sous-catégorisation initiale......................................................................... 45
1.6 Q
UESTIONS LIEES A L
'
INTERFACE SYNTAXE
/
SEMANTIQUE
................................................................. 46
1.6.1 La correspondance entre arguments sémantiques et actants grammaticaux........................... 46
1.6.2 Le lemme principal n'est pas toujours la tête syntaxique......................................................... 48
1.6.3 Les actants grammaticaux non référentiels .............................................................................49
1.6.4 Un argument du lexème peut être réalisé comme un actant d'un autre lexème ....................... 50
1.7 U
NE FORMALISATION DU
PCPA,
EN TERMES FONCTIONNELS
...........................................................52
1.8 D
ES LEXIQUES POSSIBLES POUR LA
MG............................................................................................ 52
2. L'APPAREIL FORMEL UTILISE .................................................................................................... 54
2.1 U
N GRAPHE D
'
HERITAGE MULTIPLE ET
(
PRESQUE
)
MONOTONE
......................................................... 54
2.1.1 Héritage : définition formelle et exemples d'utilisation en linguistique................................... 54
2.1.2 Héritage dans la MG ...............................................................................................................59
2.2 D
ESCRIPTIONS PARTIELLES D
'
ARBRES
............................................................................................... 61
1 / 386 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !