ManuelUnitex1.2

Telechargé par audelineshmidt
UNITEX 1.2
MANUEL DUTILISATION
Université de Marne-la-Vallée
http://www-igm.univ-mlv.fr/~unitex
Sébastien Paumier - Mai 2006
2
Table des matières
Introduction 9
1 Installation d’Unitex 11
1.1 Licences ........................................ 11
1.2 Environnement d’exécution Java .......................... 11
1.3 Installation sous Windows .............................. 12
1.4 Installation sous Linux et MacOS .......................... 12
1.5 Première utilisation .................................. 12
1.6 Ajout de nouvelles langues ............................. 13
1.7 Désinstallation ..................................... 14
2 Chargement d’un texte 15
2.1 Sélection de la langue ................................. 15
2.2 Format des textes ................................... 15
2.3 Edition de textes .................................... 18
2.4 Ouverture d’un texte ................................. 19
2.5 Prétraitement du texte ................................ 19
2.5.1 Normalisation des séparateurs ....................... 20
2.5.2 Découpage en phrases ............................ 22
2.5.3 Normalisation de formes non ambiguës .................. 23
2.5.4 Découpage du texte en unités lexicales .................. 24
2.5.5 Application de dictionnaires ........................ 26
2.5.6 Analyse des mots composés libres en allemand, norvégien et russe . . 29
2.6 Ouverture d’un texte taggué ............................. 30
3 Dictionnaires 31
3.1 Les dictionnaires DELA ............................... 31
3.1.1 Format des DELAF .............................. 31
3.1.2 Format des DELAS .............................. 34
3.1.3 Contenu des dictionnaires .......................... 34
3.2 Vérification du format d’un dictionnaire ...................... 36
3.3 Tri ............................................ 38
3.4 Flexion automatique ................................. 40
3.5 Compression ...................................... 43
3.6 Application de dictionnaires ............................. 44
3
4
TABLE DES MATIÈRES
3.6.1 Priorités .................................... 44
3.6.2 Règles d’application des dictionnaires ................... 45
3.6.3 Graphes dictionnaires ............................ 45
3.7 Bibliographie ..................................... 47
4 Recherche d’expressions rationnelles 51
4.1 Définition ....................................... 51
4.2 Unités lexicales .................................... 51
4.3 Motifs .......................................... 52
4.3.1 Symboles spéciaux .............................. 52
4.3.2 Masques lexicaux ............................... 52
4.3.3 Contraintes grammaticales et sémantiques ................ 53
4.3.4 Contraintes flexionnelles ........................... 53
4.3.5 Négation d’un motif ............................. 54
4.4 Concaténation ..................................... 56
4.5 Union .......................................... 56
4.6 Étoile de Kleene .................................... 56
4.7 Filtres morphologiques ................................ 57
4.8 Recherche ....................................... 58
4.8.1 Configuration de la recherche ........................ 58
4.8.2 Affichage des résultats ............................ 59
5 Grammaires locales 65
5.1 Formalisme des grammaires locales ........................ 65
5.1.1 Grammaires algébriques ........................... 65
5.1.2 Grammaires algébriques étendues ..................... 66
5.2 Édition de graphes .................................. 66
5.2.1 Importation d’un graphe Intex ....................... 66
5.2.2 Création d’un graphe ............................ 67
5.2.3 Sous-graphes ................................. 69
5.2.4 Répertoire de dépôt ............................. 70
5.2.5 Manipulation des boîtes ........................... 73
5.2.6 Sortie ...................................... 73
5.2.7 Utilisation des variables ........................... 74
5.2.8 Copie de listes ................................. 75
5.2.9 Symboles spéciaux .............................. 76
5.2.10 Commandes de la barre d’icônes ...................... 76
5.3 Options de présentation ............................... 78
5.3.1 Tri des lignes d’une boîte .......................... 78
5.3.2 Zoom ...................................... 78
5.3.3 Antialiasing .................................. 78
5.3.4 Alignement des boîtes ............................ 79
5.3.5 Présentation, polices et couleurs ...................... 81
5.4 Les graphes en dehors d’Unitex ........................... 84
5.4.1 Inclusion d’un graphe dans un document ................. 84
TABLE DES MATIÈRES
5
5.4.2 Impression d’un graphe ........................... 84
6 Utilisation avancée des graphes 85
6.1 Les types de graphes ................................. 85
6.1.1 Graphes de flexion .............................. 85
6.1.2 Graphes de prétraitement .......................... 86
6.1.3 Graphes de normalisation de l’automate du texte . . . . . . . . . . . . 87
6.1.4 Graphes dictionnaires ............................ 88
6.1.5 Graphes syntaxiques ............................. 88
6.1.6 Grammaires ELAG .............................. 88
6.1.7 Graphes paramétrés ............................. 88
6.2 Compiler une grammaire .............................. 89
6.2.1 Compilation d’un graphe .......................... 89
6.2.2 Approximation par un transducteur à états finis ............. 89
6.2.3 Contraintes sur les grammaires ....................... 90
6.2.4 Détection d’erreurs .............................. 93
6.3 Contextes ........................................ 94
6.4 Exploration des chemins d’une grammaire .................... 96
6.5 Collection de graphes ................................. 98
6.6 Règles d’application des transducteurs ....................... 99
6.6.1 Insertion à gauche du motif reconnu .................... 99
6.6.2 Application en avançant ........................... 100
6.6.3 Priorité à gauche ............................... 100
6.6.4 Priorité aux séquences les plus longues .................. 101
6.6.5 Sorties à variables ............................... 101
6.7 Application des graphes aux textes ......................... 105
6.7.1 Configuration de la recherche ........................ 105
6.7.2 Concordance ................................. 105
6.7.3 Modification du texte ............................ 106
6.7.4 Extraction des occurrences ......................... 107
6.7.5 Comparaison de concordances ....................... 108
7 Automate du texte 111
7.1 Présentation ...................................... 111
7.2 Construction ...................................... 112
7.2.1 Règles de construction de l’automate du texte . . . . . . . . . . . . . . 113
7.2.2 Normalisation de formes ambiguës .................... 114
7.2.3 Normalisation des pronoms clitiques en portugais . . . . . . . . . . . . 114
7.2.4 Conservation des meilleurs chemins .................... 118
7.3 Levée d’ambiguïtés lexicales avec ELAG ...................... 120
7.3.1 Grammaires de levée d’ambiguïtés ..................... 120
7.3.2 Compilation des grammaires ELAG .................... 122
7.3.3 Levée d’ambiguïtés .............................. 122
7.3.4 Ensembles de grammaires .......................... 125
7.3.5 Fenêtre de processing d’ELAG ....................... 126
1 / 217 100%

ManuelUnitex1.2

Telechargé par audelineshmidt
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !