La Conjugaison des verbes arabes avec Intex

publicité
La Conjugaison des verbes
arabes avec Intex
Ibtihal FARAWI
Laboratoire LASELDI
Université de Franche –Comté
30,rue Mégevand
25000 – Besançon
[email protected]
Mot clé : système intex, conjugaison
des verbes arabes, delas, delaf
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
La conjugaison
 La langue arabe est une langue
sémitique. La conjugaison des
verbes est basée sur la
modification des racines indiquant
ainsi les variations du sens de
base.
 Il existe deux temps : Le passé et
le présent.
 Il existe deux voix : La voix active
et la voix passive.
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Suite
Il existe plusieurs formes duelles :
-- 2ème personne du pluriel.
-- 2 personnes (m + f), (m+m) ou (f+f)
-- 3ème personne du pluriel masculin
(m+m).
-- 3ème personne du pluriel
féminin(f+f).
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Les codes flexionnels
Voix active
A
Le passé
I
Le présent:
‫الماضي‬
‫ا لمضارع‬
-- indicatif
P
‫ا لمضارع المرفوع‬
-- apocopé
C
‫ا لمضارع المنصوب‬
-- subjonctif
S
‫ا لمضارع المجزوم‬
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Suite
Voix Passive
K
Le passé
I
Le présent:
‫الماضي‬
‫ا لمضارع‬
-- indicatif
P
‫ا لمضارع المرفوع‬
-- apocopé
C
‫ا لمضارع المنصوب‬
-- subjonctif
S
‫ا لمضارع المجزوم‬
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
suite
Le futur
F
‫المستقبل‬
L’impératif
Y
‫األمر‬
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
L’impératif
 Il n‘existe qu’à la 2ème personne.
 Il est représenté sous cinq formes :
2ème personne du singulier masculin
2ème personne du singulier féminin
2ème personne du pluriel masculin
2ème personne du pluriel féminin
2ème de pluriel duel (féminin et
masculin).
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Futur :
Trois possibilités
 Le verbe est au présent de l’indicatif
accompagné d’un adverbe de temps.
 Le verbe au présent de l’indicatif est
précédé par le mot ‫ف‬
ََ ‫سـ َ ْو‬.
 Le verbe au présent à l’indicatif est
précédé d’une particule : ‫ ( سـ‬la
lettre S en préfixe). C’est cette
possibilité qui sera développée dans
la première partie de cette étude.
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Les pronoms personnels :
Les codes flexionnels
1ère personne
Je ou moi
‫أنـا‬
1s
nous
‫نـحـْ ُن‬
1p
2ms
Toi ou tu
‫أنـْت‬
‫أنـْت‬
Vous (duel f ou m)
‫أنــْتــُما‬
4
Vous ( m)
‫أنـْـتـ ُ ْم‬
‫أنــْـتـُن‬
2mp
2ème personne
Toi ou tu
Vous (f)
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
2fs
2fp
suite
3ème personne
Il ou lui
‫هـُو‬
3ms
Elle
‫هـي‬
3fs
Eux(duel) féminin
‫هـُمـا‬
3df
Eux (duel) masculin
‫هـُمـا‬
3dm
Ils ou eux
‫هـ ُ ْم‬
3mp
elles
‫هـُن‬
3fp
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Codage informatique différent
du codage linguistique
Il existe une différence de forme des
lettres selon leur place dans le mot
(position initiale, médiale, finale ou
isolée).
une lettre arabe correspond à
plusieurs codes informatiques;
une séquence de deux lettres (alef
+ hamza) a un seul code.
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Codage linguistique
 Transcrire les lettres arabes sous
forme de caractères (latins).
 => Une lettre arabe doit être codée
par un caractère, quelle que soit sa
position dans le mot
 Le code de transcription correspond à
la vraie prononciation des lettres,
quand cela est possible.
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Deux transcriptions
 Représentation graphique
(WEB/WORD/Unicode) =>
Représentation linguistique (Intex ;
caractères latins)
 Représentation Intex => texte
graphique (ex. Unicode).
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Les caractères arabes
Unicode glyphe
nom
de la
lettre
ex
isolée initiale
0621
‫س‬
sin
‫سماء‬
‫سـ س‬
‫ س سـ‬s
0634
‫ش‬
shin ‫شهاب‬
‫شـ ش‬
‫ش شـ‬
0635
‫ص‬
çad
‫ ص صـ صـ ص‬ç
‫صبر‬
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
média
le
finale
trans
cripti
on
j
Exemple
 Jãrãbã ___
‫شـرب‬
 j ‫ ش‬ treizième lettre de l’alphabet
 ãَََ
 une voyelle brève
 r‫ ر‬ dixième lettre de l’alphabet
 ã َ  une voyelle brève
 b‫ ب‬ deuxième lettre de l’alphabet
 ãَََ
 une voyelle brève
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
DELAS
 10 000 entrées composent le
dictionnaire DELAS.
 Exemple :
acãbãacã,V77
acãböã,V69
tãacãböãbã,V23
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
DELAF
 127 classes flexionnelles sont
répertoriées dans ce dictionnaire.
 Exemple:
4RvCRãRfvto/AI1s +
4RvCRãRfvnãa/AI1P +
4RvCRãRfvtã/AI2ms +
4RvCRãRfvti/AI2fs +
4RvCRãRfvtomãa/AI4 +
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Conclusion et objectifs
 Continuer à décrire le vocabulaire
de la langue arabe standard.
(nom, adverbe, adjectif…. Etc.)
 l’objectif final est de construire un
analyseur automatique des corpus
ouverts en utilisant Intex.
6th INTEX Workshop - Sofia,
Bulgarie, 28-30 May 2003
Téléchargement