2. FONCTIONNEMENT D’UN SYSTEME DE T.A.L.
Pour pouvoir présenter d’une manière claire les techniques de T.A.L., nous
allons adopter une vision très théorique qui décompose l’analyse d’un
texte en quatre étapes successives d’analyse :
L’analyse morpho lexicale, qui se préoccupe de la structure des mots ;
L’analyse syntaxique, dédiée à l’analyse de la structure des phrases ;
L’analyse sémantique, qui s’intéresse au sens des phrases considérées
individuellement ;
L’analyse pragmatique, qui s’attache à remettre un contexte autour des
phrases.
(cf schéma page 5)
Dans la pratique, un texte n’est pas soumis à l’analyse successive de
différents modules, chacun traitant une caractéristique spécifique du
langage. Ces différents niveaux d’analyse interagissent dynamiquement
au cours du traitement d’un document écrit. Cette distinction entre les
caractéristiques du langage n’a donc qu’un intérêt pédagogique.
De plus, certains outils se consacrent à l’analyse de la structure des
phrases alors que d’autres tentent de comprendre les textes à partir du
sens des mots. De tels systèmes, basés sur l’analyse sémantique,
s’intéressent à la signification des mots plutôt qu’à leur rôle syntaxique.