MINISTÈRE DE L’ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE SCIENTIFIQUE
UNIVERSITÉ MOULOUD MAMMERI DE TIZI OUZOU
FACULTÉ DE GÉNIE ÉLECTRIQUE ET D’INFORMATIQUE
DÉPARTEMENT D’INFORMATIQUE
THÈSE DE DOCTORAT D’ÉTAT
SPÉCIALITÉ : INFORMATIQUE
Présentée par
Farida YAMOUNI AOUGHLIS
Sujet
Construction d’un dictionnaire électronique de
terminologie informatique et analyse automatique de
textes par grammaires locales
Soutenue le 12/12/2010 devant le jury d’examen composé de :
Mr Soltane AMEUR
Professeur
UMMTO
Président
Mme Elisabeth Métais
Professeur
CNAM, Paris
Rapporteur
Mr Max Silberztein
Professeur
U. de Franche-Comté
Co-Rapporteur
Mr Mohand Boughanem
Professeur
U. P. Sabatier Toulouse
Examinateur
Mr Rachid Ahmed Ouamer
Maître de Conférences
UMMTO
Examinateur
Remerciements
Je tiens à remercier tout particulièrement et à témoigner toute ma reconnaissance à ma
directrice de thèse, le professeur Elisabeth Métais pour tous ses encouragements, ses conseils.
Je tiens aussi à remercier très vivement mon co-directeur de thèse, Max Silberztein,
professeur à l‘Université de Franche-Comté pour tout le temps précieux qu‘il m‘a consacrée,
son aide, sa disponibilité.
Mes respects et ma gratitude vont également aux membres de mon jury qui m'ont fait
l'honneur de juger ce travail :
A Monsieur Soltane Ameur, professeur à l‘Université Mouloud Mammeri de Tizi Ouzou,
pour m‘avoir fait l‘honneur d‘être président du jury ;
A Monsieur, Mohand Boughanem, professeur à l‘université de Toulouse pour avoir accepté
de juger mon travail ;
A Monsieur Rachid Ahmed Ouamer, Maître de conférences à l‘Université de Tizi Ouzou pour
avoir accepté de juger mon travail.
A mes chers enfants
A la mémoire de ma très chère maman
A la mémoire de Maurice Gross
Table des matières
Introduction .......................................................................................................................................... 18
Problématique .................................................................................................................................. 18
Objectifs ........................................................................................................................................... 19
Plan de la thèse ................................................................................................................................. 19
1 Etat de l‘art sur l'extraction automatique de terminologie ............................................................ 22
1.1 Introduction ........................................................................................................................... 22
1.2 L‘extraction de terminologie ................................................................................................. 22
1.2.1 Extraction manuelle ...................................................................................................... 22
1.2.1.1 La collecte de textes écrits .................................................................................... 22
1.2.1.2 La lecture des textes et l’extraction ...................................................................... 23
1.2.1.3 L’acquisition .......................................................................................................... 23
1.2.2 Extraction automatique ................................................................................................. 23
1.3 Les outils d‘extraction automatique de terminologie ............................................................. 23
1.4 Les différentes approches ...................................................................................................... 24
1.4.1 Les méthodes linguistiques ........................................................................................... 24
1.4.1.1 TERMINO .............................................................................................................. 24
1.4.1.2 LEXTER .................................................................................................................. 26
1.4.1.3 FASTER .................................................................................................................. 27
1.4.1.4 XTERM .................................................................................................................. 28
1.4.1.5 TERMINAE ............................................................................................................. 28
1.4.2 Les méthodes statistiques.............................................................................................. 28
1.4.2.1 ANA (Acquisition Naturelle Automatique) ............................................................ 29
1.4.2.2 MANTEX ................................................................................................................ 30
1.4.2.3 LIKES ..................................................................................................................... 30
1.4.3 Les méthodes mixtes..................................................................................................... 30
1.4.3.1 ACABIT (Automatic Corpus Based Acquisition of Binary terms) ............................ 30
1.4.3.2 ASIUM ................................................................................................................... 31
1.4.3.3 XTRACT ................................................................................................................. 31
1.5 Tableau récapitulatif ............................................................................................................. 32
1.6 Conclusion ............................................................................................................................ 33
2 Les dictionnaires électroniques et les bases de données terminologiques ..................................... 35
2.1 Introduction ........................................................................................................................... 35
2.2 Le système DELA ................................................................................................................. 35
2.2.1 Introduction .................................................................................................................. 35
2.2.2 Les dictionnaires des mots simples DELAS ................................................................ 36
2.2.3 Le dictionnaire des mots composés DELAC ................................................................ 36
2.2.3.1 Exemples d’entrées............................................................................................... 37
2.2.3.2 Les différentes classes de noms composés ........................................................... 37
2.2.3.2.1 Noms composés binaires (longueur 2) ............................................................... 37
2.2.3.2.2 Noms composés ternaires ................................................................................... 38
2.2.3.2.3 Plus longs............................................................................................................ 38
2.2.4 Le dictionnaire des mots composés fléchis DELACF...................................................... 39
2.2.5 Le Lexique-grammaire ................................................................................................. 39
2.2.5.1 Introduction .......................................................................................................... 39
2.2.5.2 Le lexique-grammaire des verbes du français ....................................................... 40
2.3 Les dictionnaires de terminologie et bases de données terminologiques ............................... 41
2.3.1 IATE ............................................................................................................................. 41
2.3.2 Le dictionnaire SensAgent ............................................................................................ 43
2.3.3 Le glossaire OSINET .................................................................................................... 45
2.3.4 Le dictionnaire électronique LVF ................................................................................. 45
2.3.5 Dictionnaire de l’informatique et de l’internet Dicofr.com .......................................... 46
2.3.6 Le répertoire terminologique 2000 ............................................................................... 47
2.3.7 UNBIS .......................................................................................................................... 48
1 / 188 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !