TICAM 2012

publicité
De la taxinomie au traitement automatique des verbes en
amazighe
L’houssaine EL GHOLB
FLSHR, Université Mohammed V-Agdal, Maroc
[email protected]
Résumé.
La présente communication prend, comme point de départ, notre expérience personnelle
(Master 2 et doctorat) pour regrouper et ordonner une base de données d’environs 4700
monèmes verbaux en amazighe, à partir de l'examen de diverses habiletés et attitudes
morphologiques qui les caractérisent. Notre objectif principal est de « mécaniser » les
processus morphologiques mis en application par les classes verbales, lors de la formation de
différents thèmes verbaux, pour permettre leur généralisation.
Certainement, ce travail nécessite des compétences diverses que nous pouvons grouper en
trois volets : premièrement, le volet linguistique qui décrit des connaissances relatives à la
langue ; le volet formel qui exprime ces connaissances dans un formalisme qui convient au
TAL ; et finalement, le volet informatique qui utilise cette description formelle des
connaissances dans une application informatique concrète, c’est-à-dire, la création de
programmes informatiques capables de transformer un objet d’entrée en un objet de sortie.
Devant l'étendue du domaine, cette communication tentera d’aborder le volet linguistique et
formel d’un sous-ensemble des verbes étant donné l’ampleur de la tâche et l’hétérogénéité des
faits linguistiques qui caractérise la morphologie verbale. Ainsi, nous allons nous baser sur les
propriétés morphologiques du verbe simple puisqu’il se situe en haut de la taxinomie des
verbes et constitue la base de départ de la dérivation verbale.
Les problèmes posés par la taxinomie et la classification des verbes se manifestent aux
différents niveaux et se trouvent, à priori, dans la définition des classes et des groupes de
verbes qui se heurte à des contraintes diverses. Le problème d’irrégularité des classes est
rendu plus épineux encore lorsqu’il s’agit d’une exploitation liée au TAL. En effet, la plupart
des verbes connaissent des variations apparentes, sur lesquels nous ne nous attarderons pas,
car étudier tous ces variations irait bien au-delà de notre modeste communication.
Téléchargement