- 4 -
<Semantic_Formula status="a_completer"/>
<Construction TLF_source_info="cod">
<Syntactic_Position syntactic_id="sp_0" syntactic_category="np" grammatical_case="nominative"
syntactic_function="subj" status="mandatory" />
<Syntactic_Position syntactic_id="sp_1"syntactic_category="underspecified" grammatical_case="underspecified"
syntactic_function="underspecified" status="mandatory" />
</Construction>
....... </Constr_Set></Sense><lexical_Entery/>
Cette seconde expérience assure que chacun des verbes de la liste TSNLP dispose d'au moins une
entrée lexicale dans le lexique obtenu avec au moins une construction.
4. Conclusion
Ces expériences sont encourageantes dans la mesure où elles montrent qu'il est possible d'acquérir des
informations lexicales à partir du TLFi tout en respectant les principes que l'on s'est fixé en termes de
compatibilité avec le modèle LMF, de validité linguistique et d'utilité pour la communauté scientifique. Elles
montrent aussi un certain nombre de lacunes, tant du point de vue des données sources que de celui de la
procédure d'acquisition.
Concernant le TLFi, il faut rappeler qu'il n'a pas été conçu dans une perspective d'exhaustivité syntaxique et
que les objets "construction" analysés ne décrivent donc pas l'ensemble des constructions syntaxiques dans
lesquelles un verbe peut apparaître. D'autre part, l'utilisation de ces objets "construction" a correspondu à une
époque de rédaction et n'est donc pas également représentée sur l'ensemble du dictionnaire. Enfin, la
procédure de rétroconversion n'a pas permis de reconnaître l'ensemble des expressions candidates à devenir
des objets "construction". Cela peut se remarquer pour certaines définitions, certains indicateurs d'emploi,
syntagmes ou crochets dont le contenu fait penser à un objet "construction" mais qui n'a pas été reconnu
comme tel, la plupart du temps du fait du non-respect d'un certain nombre de contraintes typographiques qui
servaient d'indices dans la rétroconversion.
Concernant la procédure d'acquisition, plusieurs aspects n'ont pas encore été pris en compte et devront l'être.
D'une part, les informations utiles pour un cadre de sous-catégorisation peuvent être éclatées sur plusieurs
niveaux hiérarchiques. Le cas du verbe provoquer est éloquant. Dans son emploi B, on trouve la construction
qqn/qqc provoque qqn à, puis en B.1. + subst et + inf. en B.2. Le croisement de B et B.1 permettrait
d'obtenir le cadre plus précis qqn/qqc provoque qqn à + subst, et cela de même en croisant B et B.2.
D'autre part, à la suite de LMF, les cadres de sous-catégorisation obtenus devraient être associés à des sens
du verbe, sous-spécifiés pour l'instant. Pour ce faire, si l'on s'en tient à l'utilisation du TLFi, nous utiliserons
très probablement la structure hiérarchique des articles au format XML. La question encore en suspens
concerne le mode de propagation de l'information entre les sens (ici supposés correspondre aux définitions)
et les objets "construction", héritage, percolation ? La même question se posera aussi concernant la
propagation de l'information fournie par le code grammatical d'un verbe, est-elle valide pour l'ensemble de
l'article ?
Références
BONFANTE, Guillaume, GUILLAUME, Bruno et PERRIER, Guy (2003). Analyse électrostatique. Traitement automatique
des langues.
CRABBE, Benoit, GAIFFE, Bertrand et ROUSSANALY, Azim (2003). Représentation et gestion de grammaires TAG
lexicalisées. Traitement Automatique des Langues.
DENDIEN, Jacques, et PIERREL, Jean-Marie (2002). Le trésor de la langue française informatisé : un exemple
d'informatisation d'un dictionnaire de langue de référence. Traitement Automatique des Langues.
EAGLES Computational Lexicons Working Group Reading Guide, citeseer.nj.nec.com/438129.html
FRANCOPOULO, Gil (2003). Proposition de norme des Lexiques pour le traitement automatique des langues, CN RNIL
N 7, 21 p., http://pauillac.inria.fr/atoll/RNIL/
GROSS, Maurice (1975). Méthodes en syntaxe, Herman, Paris.
IDE, Nancy et ROMARY, Laurent (2001). A Common Framework for Syntactic Annotation. In Association for
Computational Linguistics - ACL'2001. (Toulouse, France), 8 p.
IDE, Nancy et ROMARY, Laurent (2002). Standards for Language Resources. In Third International Conference on
Language Resources and Evaluation - LREC'2002. (Las Palmas, Spain), 9 p.
MEL'CUK, Igor, CLAS, André et POLGUERE, Alain (1995). Introduction à la lexicologie explicative et combinatoire.
Louvain : Editions Duculot.
MONTE, Georges (2003). Terminology and other language resources -- Lexical Markup Framework (LMF), ISO TC
37/SC 4 N088, 16 p., http://pauillac.inria.fr/atoll/RNIL/
ROMARY, Laurent. Site de l'action SYNTAX. http://syntax.loria.fr/
VERONIS, Jean (2004), Quels dictionnaires pour l'étiquetage sémantique, Le français moderne, 2004/1, pp.27-38.