atelier international sur l’amazighe et les TIC
ème
5
L'approche symbolique: Cette approche est basée sur la segmentation du mot
en préfixes, infixes et suffixes dans le but d'extraire la racine du mot arabe. Plusieurs
analyseurs morphologiques ont été élaborés et qui s'appuient sur cette approche
(Darwish, 2002 ; Buckwalter, 2002 ; Hegazi et ElSharkawi, 1986 ; Koskenniemi, 1983
; Beesly, 1998 ; El-Sadany et Hashish, 1989 ; Khoja et Garside, 1999 ; Soudi, 2002).
Parmi les analyseurs les plus connus pour cette approche est celui de Buckwalter ce
dernier consiste à déterminer toutes les segmentations possibles du mot, puis à
chercher les résultats dans les listes des radicaux, des suffixes et des préfixes, et vérifie
ensuite si les morphologies de chacun des éléments sont compatibles entre elles en
examinant trois tables de correspondances : préfixe-radical, préfixe-suffixe, radical-
suffixe.
L'approche statistique: Cette approche calcule les possibilités et les probabilités qu'un
préfixe, suffixe et un radical peuvent apparaître ensemble dans une base de données
des mots (Goldsmith et John, 2001).
L'approche hybride: cette approche combine entre les deux approches précédentes
(Darwish, 2002).
Malgré les avantages de ces approches, on remarque qu'il y a toujours des inconvénients pour
ces dernières, on cite par exemple:
Le dictionnaire des mots est très grand, et il est très difficile de construire un
dictionnaire contenant tous les mots arabes. Ces dictionnaires des mots contiennent
une sorte de répétition des noms ayant les mêmes règles morphologiques '
–
' '
–
'.
Ces approches utilisent plusieurs règles au moment de l'analyse morphologique.
Pour remédier à ces problèmes, nous avons développé un analyseur morphologique
indépendant du dictionnaire des mots et n'utilisant pas les règles au moment de l'analyse
morphologique. Notre système utilise uniquement les schèmes de surface du mot à analyser.
2. Construction de la base des schèmes de surface des noms dérivés
2.1 Noms dérivés arabe
Les noms dérivés se sont les noms qui peuvent être dérivés à partir d’une racine verbale. Le
nombre et la nature de ces formes varient selon le statut du verbe auquel ils se rattachent.
Parmi les noms dérivés (Voir Tab 1), on cite (Mesfar, 2008):
Le Participe Actif '
' : est un nom associé à tout verbe d'action, et qui désigne
l'agent du verbe c'est-à-dire celui qui fait l'action. Par exemple, le verbe '
'a pour
nom actif '
'
Le Participe Passif '
' : est un nom associé à tout verbe d’action transitif. Il
désigne le patient qui subit l’action ou le résultat de cette action. Par exemple le verbe
'' a pour participe passif ' ''.
Nom Verbal ' ' : est un nom abstrait formé sur la même racine que le verbe
auquel il est associé et exprime le même contenu sémantique que le verbe. Un verbe
peut avoir plus qu'un nom verbal. Par exemple, le verbe '
' admet quatre noms
verbaux différents '
'.
La qualité similaire '
' : Les noms de la qualité similaire indiquent la
présence absolue de la qualité de celui qui a fait l’action, comme ''.