INTRODUCTION
Élève en Master 2 Recherche en Informatique Linguistique
visant à faire une thèse, je suis tenue d’effectuer un stage de 4 à 6
mois en laboratoire dans le but de me familiariser avec le milieu de
la recherche.
L’Institut d'électronique et d'informatique Gaspard-Monge
(IGM) m’a offert l’opportunité de travailler au sein de leur équipe
linguistique, me proposant de participer à leur projet d'analyseur
syntaxique LGTag.
Ce stage, qui a débuté en mars 2007 et se termine en
septembre 2007 par sa présentation, me permet d’acquérir une
seconde expérience dans le domaine de la linguistique. Il me permet
aussi de confirmer mon choix de poursuite en thèse, et spécialement
sur ce sujet.
Avec la très grande quantité d’informations disponibles sur
Internet ou, de manière plus générale, sur support informatique,
créer des outils qui automatisent l'exploration et l'extraction
d'informations pertinentes dans les textes ou la traduction est
crucial. Les outils linguistiques utilisés sont tout d’abord l’analyse
morpho-syntaxique qui est très largement utilisée, mais aussi
l’analyse syntaxique qui n’est pas encore au point. En effet, les
systèmes d'analyse syntaxique sont de plus en plus nombreux mais
ils doivent faire face à la complexité et la grandeur de la langue.
Ce stage consiste principalement à vérifier la faisabilité de la
lexicalisation des grammaires d'arbres adjoints à partir du lexique-
grammaire dans le but d'une analyse syntaxique automatique sur des
textes réels.
Ce stage s’insère dans un projet interne à l'équipe de
linguistique. Il est détaillé en première partie avec une présentation