République Algérienne Démocratique et Populaire ﺔﻴﺒﻌــﺸﻟﺍ ﺔــﻴﻁﺍﺭﻘــﻤﻴﺩﻟﺍ ﺔــﻴﺭﺌﺍﺯــﺠﻟﺍ ﺔــــﻴﺭﻭﻬﻤـﺠﻟﺍ
Ministère de l’Enseignement Supérieur et de la Recherche Scientifique
ﻤـــﻠﻌﻟﺍ ﺙﺤــﺒﻟﺍ ﻲﻟﺎــﻌﻟﺍ ﻡـﻴﻠﻌـﺘﻟﺍ ﺓﺭﺍﺯﻭ
Université Abou Bekr BELKAID TLEMCEN
Faculté des Sciences de l’ingénieur
Département d’informatique
THESE
Présentée par
Mohammed El Amine ABDERRAHIM
Pour obtenir le titre de doctorat
Université Abou Bekr BELKAID TLEMCEN
Spécialité : Informatique
Titre :
Reconnaissance des unités
linguistiques signifiantes
Soutenue le 08 Juillet 2008 devant le jury composé de :
Mr Mohamed Amine CHIKH (MC Univ. Tlemcen) Président
Mr Fethi BEREKSI REGUIG (Prof. Univ. Tlemcen) Encadreur
Mme Laurence BALICCO (Prof. GRENOBLE 3 ) Encadreur
Mr Abdelkader BENYETTOU (Prof. Univ. USTO) Examinateur
Mr Sidi Mohamed RETERI (Prof. Univ. Tlemcen) Examinateur
Année universitaire: 2007/2008
Dédicaces
A
Djamila
J
e dédie cette thèse.
Table des matières
Table des matières……………………….………………….I-V
Introduction…………………………………………………...……..1
Chapitre 1 : Le traitement automatique
des langues naturelles
1. INTRODUCTION..........................................................................................................7
2. DIFFERENTS NIVEAUX D’ANALYSES..................................................................8
2.1. ANALYSE MORPHOLOGIQUE.......................................................................................9
2.2. ANALYSE SYNTAXIQUE ............................................................................................14
2.3. ANALYSE SEMANTIQUE............................................................................................16
2.4. ANALYSE PRAGMATIQUE..........................................................................................18
3. CONSTRUCTION D’UN SYSTEME DE TALN.....................................................18
4. CONCLUSION ............................................................................................................20
Chapitre 2 : Mot graphique
et traitement automatique de l’arabe
1. INTRODUCTION……………………………………………………………………22
2. LES CONSTITUANTS DU MOT GRAPHIQUE ARABE………………………..24
2.1 LE MOT GRAPHIQUE ..................................................................................................24
2.2. LES CLITIQUES .........................................................................................................25
2.3 LA BASE ....................................................................................................................26
2.3.1 La racine...........................................................................................................26
2.3.2 Le schème..........................................................................................................28
2.4. FLEXION...................................................................................................................29
3. LES DIFFERENTS TYPES DE TEXTES ARABES………………………………30
3.1 TEXTE NON VOYELLE ................................................................................................31
3.2 TEXTE NON VOYELLE AVEC ’SHADDA......................................................................31
3.3 TEXTE PARTIELLEMENT VOYELLE (SEMI-VOYELLE)..................................................31
3.4 TEXTE COMPLETEMENT VOYELLE .............................................................................32
4. LE PROBLEME DE LA VOYELLATION………………………………………...32
4.1 AMBIGUÏTE EN DEFINITION........................................................................................33
4.2 AMBIGUÏTE EN USAGE...............................................................................................33
4.3 APPROCHES POUR RESOUDRE LAMBIGUÏTE ..............................................................34
5. LA PONCTUATION…………………………………………………………………35
I
Table des matières
6. PROBLEMES DU TRAITEMENT AUTOMATIQUE DE L’ARABE…………..35
7. CONCLUSION……………………………………………………………………….36
Chapitre 3 : Les analyseurs existants
et le choix d’une organisation
1. INTRODUCTION……………………………………………………………………39
2. LES ANALYSEURS EXISTANTS………………………………………………….40
2.1 L’ANALYSEUR DE [HASS-1987]...............................................................................40
2.2 L’ANALYSEUR DU PROJET SAMIA [HASS-1987].....................................................41
2.2.1 Le modèle d’analyse du projet SAMIA .............................................................41
2.2.2 L’analyse dans le projet SAMIA.......................................................................43
2.3 L’ANALYSEUR DE [SARO-1989] ..............................................................................45
2.3.1 L’Analyse morphologique.................................................................................46
2.3.2 Le dictionnaire..................................................................................................49
2.4 L’ANALYSEUR MORPHOLOGIQUE DE [ZOUA-1989] .................................................50
2.4.1 Construction du dictionnaire............................................................................52
2.4.2 Les résultats de l’analyseur..............................................................................52
2.5 L’ANALYSEUR MORPHOLOGIQUE DE [BEN-1998].....................................................52
2.5.1 Le lexique de [BEN-1998]................................................................................53
2.5.2 Les règles..........................................................................................................54
2.5.3 Les étapes de l’analyse .....................................................................................54
2.5.4 Les résultats de l’analyseur de [BEN-1998] ....................................................54
2.6 L’ANALYSEUR MORPHOLOGIQUE DE [ACHO-1998] .................................................56
2.6.1 Description du lexique utilisé ...........................................................................57
2.6.2 Description de l’analyseur................................................................................57
2.6.3 Les résultats de l’analyseur..............................................................................59
2.7 L’ANALYSEUR MORPHOLOGIQUE DE [ATTI-2000] ...................................................60
2.7.1 Description du lexique utilisé ...........................................................................61
2.7.2 Description de l’analyseur................................................................................64
2.7.3 Les résultats de l’analyseur..............................................................................65
2.8 L’ANALYSEUR MORPHOLOGIQUE DE [GAUB-2001] .................................................66
2.8.1 Description du lexique utilisé ...........................................................................67
2.8.2 Description de l’analyseur................................................................................67
2.8.3 Les résultats de l’analyseur..............................................................................68
2.9 L’ANALYSEUR MORPHOLOGIQUE DE [OUER-2002]..................................................68
2.9.1 Description du lexique utilisé ...........................................................................68
2.9.2 Description de l’analyseur................................................................................69
2.9.3 Les résultats de l’analyseur..............................................................................70
2.10 L’ANALYSEUR MORPHOLOGIQUE DE [ZAAF-2002]................................................72
2.10.1 Description du lexique utilisé .........................................................................72
2.10.2 Description de l’analyseur..............................................................................73
2.10.3 Les résultats de l’analyseur............................................................................75
II
Table des matières
3. RESUME DES ANALYSEURS EXISTANTS……………………………………...75
4. LE CHOIX D’UNE ORGANISATION……………………………………………..80
5. LA SOLUTION ADOPTEE…………………………………………………………82
6. CONCLUSION……………………………………………………………………….83
Chapitre 4 : Définition du modèle linguistique
Et description de l’analyseur morphologique
1. INTRODUCTION…………………………………………………………………...86
2. LES CATEGORIES GRAMMATICALES………………………………………..87
2.1 LA CATEGORIE NOM (N)............................................................................................88
2.2 LA CATEGORIE PARTICULE (P) ..................................................................................89
2.2.1 Catégories des particules pré et postfixés ........................................................91
2.2.2 Catégories des particules isolées......................................................................93
3. LES VARIABLES MORPHO-SYNTAXIQUES…………………………………...94
3.1 AFFECTATION DES VARIABLES MORPHO-SYNTAXIQUES POUR LES FORMES NOMINALES
ET VERBALES.................................................................................................................100
3.2 LES VARIABLES MORPHO-SYNTAXIQUES DES PARTICULES PRE ET POSTFIXEES........101
3.3 AFFECTATION DES VARIABLES POUR LES PARTICULES PRE ET POSTFIXEES..............103
4. SPECIFICATION DE L’ANALYSEUR………………………………………….104
4.1 LES OBJETS DE BASE................................................................................................104
4.2 LES CATEGORIES GRAMMATICALES.........................................................................106
4.3 SOLUTION MORPHOLOGIQUE ...................................................................................106
4.4 FORME INCONNUE ...................................................................................................108
5. L’ANALYSEUR MORPHOLOGIQUE…………………………………………..108
5.1 FORME NOMINALE (FN)..........................................................................................111
5.2 FORME VERBALE (FV) ............................................................................................116
5.3 FORME UNIFIEE (FU)...............................................................................................117
5.4 LES CLITIQUES ........................................................................................................122
5.4.1 Les proclitiques...............................................................................................122
5.4.2 Les enclitiques.................................................................................................123
5.5 LES AFFIXES............................................................................................................123
5.5.1 Les préfixes .....................................................................................................124
5.5.2 Les suffixes......................................................................................................124
5.6 LES BASES...............................................................................................................124
5.6.1 Lexique des bases verbales.............................................................................124
5.6.2 Lexique des bases nominales..........................................................................125
5.7 LES MOTS OUTILS....................................................................................................126
5.8 COMPTAGE DES CLITIQUES ET AFFIXES....................................................................126
5.9 LE MODELE CONCEPTUEL DUNE FORME .................................................................127
III
1 / 225 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !