
Extrait de la Revue Informatique et Statistique dans les Sciences humaines
XXXV, 1 à 4, 1999. C.I.P.L. - Université de Liège - Tous droits réservés.
128
Béatrice
BOUCHOU,
Denis
MAUREL.
Barbara
KAt
Tl
de
la
langue naturelle est important dans ce domaine. Le traitement
automatique des questions en langue naturelle posées àune base de
donnée est donc un sujet d'études déjà ancien. Beaucoup de proposi-
tions.ont été développées dans ce domaine au cours des années 80,
accompagnant la maturation des principes du calcul symbolique logi-
que. Ces systèmes font d'abord une analyse syntaxique complète de
la
question, puis ils extraient de l'arbre syntaxique (et d'autres sources
d'information) ce qui est nécessaire àl'interprétation de
la
question en
termes d'éléments de
la
base de données.
Il est intéressant de noter cependant que les premiers travaux dans
ce domaine utilisent un lexique, pour détecter des mots clefs dans
la
question, et
la
théorie syntaxique de Z.S. Harris, pour trouver une
réponse
(BA8EBALL,
cf. Green et al., 1960). C'est ce que nous faisons,
renouant ainsi avec une piste de travail abandonnée depuis. La limite
de
la
technique mise en œuvre dans
BA8EBALL
réside dans son lien
trop étroit avec l'information traitée. En d'autres termes, on
n'a
obtenu de bons résultats de cette manière que pour des produits «
ad
hoc
»,
conçus dans un but trop particulier (Sabah 1997). Nous répon-
dons àce problème en utilisant un dictionnaire électronique contenant
le vocabulaire du domaine et une copie complète de la base (voir
§3.1). Ce qui est rendu possible par les avancées algorithmiques de
la
théorie des automates et transducteurs ànombre fini d'états. De cette
façon, l'information
n'est
plus dans les codes de traitement, mais
exclusivement dans un dictionnaire, en partie créé lors de l'installation
du
logiciel.
Les travaux qui suivirent
BA8EBALL
s'attachèrent àexploiter auto-
matiquement la base de données pour alimenter le lexique (Kaplan
1984, Grosz et
al.
1987, Clifford 1988). Le système
TEAM
développé
par
B.
Grosz et ses collègues apour objectif principal cette «porta-
bilité », c'est-à-dire la faculté de s'adapter aisément àchaque nouvelle
base de données. Pour cela, il est conçu pour interagir avec deux types
d'utilisateurs, un expert de
la
base de données,
d'une
part, l'utilisateur
final, d'autre part. Le système est général et il constmit sa connais-
sance de
la
base de données lors de son installation. Cela se fait par
interaction avec l'expert dé
la
base de données. L'essentiel de l'inter-
prétation dépend des directives de cet expert. Nous adoptons la même
démarche, mais en
la
simplifiant dans
la
mesure où nous réduisons
la