Université Stendhal-Grenoble III
UFR des Sciences du Langage
Analyse morphologique des réponses d’apprenants en
environnement d’Apprentissage Assisté par Ordinateur
Mémoire de Recherche en Sciences du Langage,
Deuxième année de Master Sciences du Langage,
spécialité Industries De la Langue,
parcours Traitement Automatique de la Langue Ecrite et Parlée
Alexia Blanchard
Directeur de recherche : Claude Ponton
1
Remerciements
A mon directeur de recherche Claude Ponton, pour la confiance qu'il m'a accordée et pour
tout ses précieux conseils.
Au personnel du DIP avec qui j'ai passé de très bons moments.
A Thomas pour son optimisme, et à Mathieu pour sa "Louis de Funesquerie".
Au bureau I 110 : à Sabrina pour ses interventions musicales, à Tiphaine pour son naturel
"sucré", à Nadia pour ses deux années passées ensemble, et à Virginie pour sa bonne
humeur légendaire.
Un merci particulier à Virginie, ma re-lectrice préférée.
A Florent, Gwen et Cédric.
A mes amies de toujours, Anne-Sophie, Lydie et Aurélie pour me supporter depuis déjà
plus de 10 ans.
2
TABLE DES MATIERES
0. INTRODUCTION........................................................................................................ 6
1. POSITIONNEMENT................................................................................................... 8
2. ANALYSE DES REPONSES D’APPRENANTS EN ALAO................................. 14
2.1. A
NALYSE DES REPONSES SANS OUTIL
TAL ........................................................... 14
2.2. A
NALYSE DES REPONSES A L
AIDE D
OUTILS
TAL ................................................ 15
2.2.1. Définition du TAL......................................................................................... 15
2.2.1.1. Niveaux de traitements en TAL ........................................................... 16
2.2.1.2. Systèmes de TAL ................................................................................. 17
2.2.2. Correcteurs orthographiques et grammaticaux........................................... 21
2.2.3. BELLOC....................................................................................................... 22
2.2.4. SAFRAN........................................................................................................ 23
2.2.5. ELEONORE.................................................................................................. 24
2.2.6. CAMILLE ..................................................................................................... 25
2.2.7. ALEXIA......................................................................................................... 26
2.2.8. Plateforme EXILLS....................................................................................... 27
2.2.9. Projet FREETEXT........................................................................................ 28
2.2.10. ALFALEX ..................................................................................................... 30
2.2.11. Plateforme MIRTO....................................................................................... 31
2.3. A
PPORTS DU
TAL.................................................................................................. 33
3. LE NIVEAU MORPHOLOGIQUE ......................................................................... 34
3.1. L
A MORPHOLOGIE
................................................................................................. 34
3.2. L
ES DIFFICULTES DE LA MORPHOLOGIE
................................................................. 35
3.2.1. Régularités et irrégularités morphologiques ............................................... 35
3.2.2. Autres difficultés........................................................................................... 36
3.3. A
NALYSE MORPHOLOGIQUE EN
TAL..................................................................... 36
3.3.1. Les contraintes d’un analyseur morphologique........................................... 37
3.3.2. Les différentes méthodes d’analyse morphologique .................................... 38
3.3.2.1. Analyse morphologique à base de dictionnaire de formes fléchies ..... 38
3.3.2.2. Analyse morphologique à base d’automates à états finis..................... 40
3.3.2.3. Analyse morphologique à deux niveaux.............................................. 43
3.4. G
ENERATION D
INFORMATIONS MORPHOLOGIQUES EN
TAL................................. 44
3.5. L
ES LIMITES DE CES METHODES
............................................................................. 45
4. L’ANALYSEUR MORPHO-SYNTAXIQUE DEVELOPPE AU CRISS............. 46
4.1. P
RESENTATION DU SYSTEME
................................................................................. 46
4.1.1. Architecture du système................................................................................ 46
4.1.2. Méthodologie................................................................................................ 47
4.1.3. Analyse morphologique................................................................................ 49
4.1.3.1. Les données.......................................................................................... 50
4.1.3.2. L'algorithme d'analyse.......................................................................... 55
4.2. L
ES LIMITES DU SYSTEME PAR RAPPORT A NOTRE SUJET
........................................ 56
3
5. MODELISATION LINGUISTIQUE.......................................................................57
5.1. A
PPLICATION DE LA METHODOLOGIE
.................................................................... 57
5.1.1. La généralisation au sein du modèle............................................................ 57
5.1.2. Le corpus FRIDA.......................................................................................... 58
5.1.3. L'analyse d'erreurs avec l'analyseur morpho-syntaxique du CRISS non-
modifié 61
5.2. M
ODIFICATIONS DU MODELE DE LA CATEGORIE
F................................................. 62
5.2.1. Traitement des erreurs de généralisation .................................................... 63
5.2.2. Traitement des autres erreurs ...................................................................... 67
5.3. M
ODIFICATIONS DU MODELE DE LA CATEGORIE
V ................................................ 70
5.3.1. Traitement des erreurs de généralisation .................................................... 70
5.3.2. Traitement des autres erreurs ...................................................................... 73
5.4. M
ISE A JOUR DU DICTIONNAIRE
............................................................................. 75
5.4.1. Le cas de la catégorie F............................................................................... 75
5.4.2. Le cas de la catégorie V............................................................................... 77
5.5. M
ODELISATION DES SORTIES DE L
'
ANALYSE
.......................................................... 78
5.5.1. Une typologie des erreurs ............................................................................ 80
5.5.2. Le cas de la catégorie F............................................................................... 81
5.5.3. Le cas de la catégorie V............................................................................... 83
6. MODELISATION INFORMATIQUE..................................................................... 85
6.1. P
OURQUOI AVOIR CHOISI
P
ROLOG COMME LANGAGE DE PROGRAMMATION
.......... 85
6.2. D
ONNEES EN ENTREE DE L
'
ANALYSEUR
................................................................. 86
6.2.1. Le cas de la catégorie F............................................................................... 87
6.2.2. Le cas de la catégorie V............................................................................... 88
6.3. A
LGORITHMES D
'
ANALYSE
.................................................................................... 89
6.4. A
UTOMATES A ETATS FINIS
................................................................................... 93
6.4.1. Le cas de la catégorie F............................................................................... 93
6.4.2. Le cas de la catégorie V............................................................................... 93
6.5. Q
UELQUES RESULTATS D
'
ANALYSE
....................................................................... 93
7. CONCLUSION ET PERSPECTIVES ..................................................................... 94
BIBLIOGRAPHIE............................................................................................................. 96
4
TABLE DES ANNEXES
ANNEXE 1 : RESUME DES RECTIFICATIONS ORTHOGRAPHIQUES DU
JOURNAL OFFICIEL DE LA REPUBLIQUE FRANÇAISE...................................... 102
ANNEXE 2 : LISTES DES FLEXIONS DES NOMS, ADJECTIFS ET VERBES... 103
ANNEXE 3 : MODELES DE FLEXIONS DES NOMS ET ADJECTIFS ................106
ANNEXE 4 : MODELES DE FLEXIONS DES VERBES........................................... 109
ANNEXE 5 : LISTE DES REGULARISATIONS POUR LES CATEGORIES F ET V
............................................................................................................................................ 111
ANNEXE 6 : ALGORITHME DE L’ANALYSEUR DU CRISS ................................ 113
ANNEXE 7 : RESULTATS DE LA COMBINATOIRE DES MODELES DE
FLEXIONS DES NOMS ET ADJECTIFS....................................................................115
ANNEXE 7 SUITE : RESULTATS DE LA COMBINATOIRE DES MODELES DE
FLEXIONS DES VERBES.............................................................................................. 125
ANNEXE 8 : LISTE DES ERREURS DU CORPUS KALEIDOSCOPE SUR LES
NOMS ET ADJECTIFS .................................................................................................. 129
ANNEXE 8 SUITE : LISTE DES ERREURS DU CORPUS KALEIDOSCOPE SUR
LES VERBES ................................................................................................................... 131
ANNEXE 9 : MODELES DE FLEXIONS POUR LA CATEGORIE F APRES
MODIFICATION DU MODELE................................................................................... 133
ANNEXE 10 : LISTE DES PAQUETS DE REGULARISATIONS DES VERBES
APRES MODIFICATION DU MODELE..................................................................... 139
ANNEXE 11 : RECAPITULATIF DES PAQUETS DE FLEXIONS DES VERBES
APRES MODIFICATIONS DU MODELE................................................................... 140
ANNEXE 12 : LISTE DES MODELES DE FLEXIONS POUR LA CATEGORIE V
APRES MODIFICATIONS DU MODELE................................................................... 142
ANNEXE 13 : ALGORITHME D'ANALYSE APRES MODIFICATIONS DU
MODELE.......................................................................................................................... 153
ANNEXE 14 : AUTOMATES UTILISES POUR L'ANALYSE DES NOMS ET
ADJECTIFS...................................................................................................................... 155
ANNEXE 14 SUITE : AUTOMATES UTILISES POUR L'ANALYSE DES VERBES
............................................................................................................................................ 160
ANNEXE 15: FICHIERS DE SORTIES DE NOTRE ANALYSEUR........................ 163
1 / 166 100%