Département de Sciences du Langage
Master Ergonomie Cognitive et Ingénierie Linguistique
Mémoire de Master 1
Indices distributionnels pour la comparaison sémantique de
dérivés morphologiques
Marine Wauquier
Sous la direction de Cécile Fabre et de Nabil Hathout
2015 - 2016
1
2
Remerciements
Je tiens à remercier du fond du cœur les personnes qui m'ont aidée et accompagnée dans la réalisation
de ce mémoire.
Je remercie dans un premier temps mes encadrants de mémoire, Cécile Fabre et Nabil Hathout, sans
qui ce travail n'aurait pas été possible. Leurs conseils avisés, leur disponibilité et leur accompagnement
m'ont été des plus précieux.
Je souhaite aussi remercier le reste de l'équipe enseignante du master LITL, Mai Ho-Dac et Ludovic
Tanguy, dont les enseignements et encouragements ont su m'aider à avancer.
Je remercie aussi Michel Roché pour le temps qu'il m'a accordé lors d'un entretien et d'échanges qui
ont fortement nourri ma réflexion.
Je tiens par ailleurs à remercier Cécile Fabre, Nabil Hathout, Franck Floricic, Christelle Lesselingue,
Edith Galy et Fiammetta Namer pour leur contribution à Lexeur, et Franck Sajous pour la préparation
du corpus et pour les données qu'il m'a fournies.
Enfin, je souhaite remercier mes camarades de classe, Amélie, Aurore, Céline, Justine et Laura, ainsi
que mes proches pour leur soutien inestimable.
3
4
Table des matières
Introduction.................................................................................................................... 7
1. Les dérivés agentifs et processifs déverbaux..............................................................9
1.1. Morphologie et dérivation...............................................................................................9
1.1.1. Morphologie lexicale..........................................................................................................9
1.1.2. Morphologie dérivationnelle.............................................................................................10
1.1.3. Morphologie constructionnelle.........................................................................................11
1.1.4. Règles de construction, schèmes et analogie.....................................................................11
1.2. Caractérisation des noms d’agents................................................................................14
1.2.1. Noms d’agents en -eur......................................................................................................15
1.2.1.1. Caractérisation syntaxique........................................................................................15
1.2.1.2. Caractérisation sémantique.......................................................................................17
1.2.2. Le cas des féminins -euse et -rice.....................................................................................20
1.2.3. Noms d'agent versus noms d'instrument...........................................................................21
1.2.3.1. Caractérisation des noms d'instrument......................................................................21
1.2.3.2. Distinction entre agent et instrument........................................................................22
1.3. Caractérisation des noms d’action.................................................................................23
1.3.1. Définition du nom d'action...............................................................................................23
1.3.2. Une typologie des noms d'action......................................................................................26
1.4. Polysémie et réseaux secondaires..................................................................................28
2. Indices distributionnels de proximité sémantique....................................................31
2.1. Similarité et catégories..................................................................................................31
2.2. Proximité distributionnelle et proximité sémantique....................................................32
2.3. Introduction à Word2Vec...............................................................................................35
3. La démarche expérimentale.....................................................................................37
3.1. Les données initiales.....................................................................................................37
3.1.1. Lexeur...............................................................................................................................37
3.1.2. Les corpus.........................................................................................................................40
3.2. Enrichissement des données..........................................................................................40
3.2.1. Enrichissement de Lexeur à l'aide de Word2Vec..............................................................40
3.2.2. Triplets nom d'agent/verbe/nom d'action..........................................................................41
3.2.3. Voisins distributionnels.....................................................................................................45
3.3. Démarche.......................................................................................................................48
4. Mise à l'épreuve de l'hypothèse................................................................................49
4.1. Fréquence et proximité distributionnelle.......................................................................49
4.2. Caractérisation des triplets nom d'agent/verbe/nom d'action........................................52
4.2. Sélection de triplets représentatifs.................................................................................58
4.2.1. En fonction du cumul des indices iAgVb + iAgAc + iVbAc............................................58
4.2.2. En fonction du rapport iAgVb / iVbAc.............................................................................64
4.3. Analyse distributionnelle de triplets..............................................................................70
4.3.1. Rapport iAgVb/iVbAc élevé............................................................................................71
4.3.1.1. tourneur – tourner – tour...........................................................................................71
4.3.1.2. fumeur – fumer – fumette.........................................................................................75
4.3.2. Rapport iAgVb/iVbAc faible............................................................................................78
4.3.2.1. trieuse – trier – tri.....................................................................................................78
4.3.2.2. corruptrice – corrompre – corruption........................................................................79
4.3.3. Rapport iAgVb/iVbAc proche de 1..................................................................................81
4.3.3.1. évangélisateur – évangéliser – évangélisation...........................................................81
4.3.3.2. chanteur/chanter/chant..............................................................................................83
Conclusion...................................................................................................................87
Bibliographie...............................................................................................................89
5
1 / 93 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !