3
Les travaux antérieurs sur le lexique des émotions
En linguistique française, de nombreux chercheurs ont étudié le lexique nominal des
émotions (voir entre autres Anscombre 1992, 1995 ; Ruwet 1994 ; Balibar-Mrabti 1995 ;
Leeman, 1995 ; Mathieu, 2000 ; Plantin et al., 2000, Flaux & Van de Velde 2000 ) en prenant
en compte leurs propriétés linguistiques, révélées essentiellement à travers leur
combinatoire syntaxique et lexicale.
Y.-Y. Mathieu (2000) a fait ses classements sur 400 verbes environ, répartis en 34-38
classes. L’équipe de Buvet (2005)
a travaillé sur l’ensemble de 293 adjectifs, 228 noms et
365 verbes, répartis dans 63 classes. Le travail du projet PPF (Augustyn et al., 2008 ) visait la
constitution d’une liste de 270 noms, 250 adjectifs et 393 verbes, réparties dans 27 classes
sémantiques selon les critères de fréquence ainsi que des traits comme polarité
(positive/négative), intensité (faible, moyenne, forte) et les niveaux de langues (courant,
littéraire, familier).
En comparant les données du projet PPF avec les données de Mathieu (2000) et
Buvet et al.(1995) (Tableau 1), il ressort que les chiffres sont assez proches, mais le nombre
de classes est différent.
Augustyn et al.
2008 (PPF)
Tableau 1 : Les données comparatives du lexique des émotions
Dans un premier temps, dans l’attente de la mise en place des corpus multilingues
(comparable set parallèles) ainsi que de l’interface d’interrogation du projet EMOLEX, il a été
décidé par les deux équipes de procéder à une étude linguistique préliminaire (étude pilote)
sur les corpus disponibles de taille équivalente (Frantext (www.frantext.fr), Ruscorpora
www.ruscorpora.ru, http://corpus.leeds.ac.uk/ruscorpora.html), BNC, corpus de presse
espagnol et allemand).
L’étude pilote
Cette étude avait pour but d’élaborer les différents outils (grilles de dimensions
sémantiques, de relations syntaxiques et de structures actancielles) et d’unifier la
méthodologie du volet linguistique du projet. Trois champs lexicaux ont été choisi :
DECEPTION, SURPRISE et RESPECT composés des lexies appropriées (noms, verbes, adjectifs) selon
le critère de fréquence (seuil de 100 occurrences après désambiguïsation).
Le tri des lexies par la fréquence
Buvet, P.-A./Girardin, Ch./Gross, G./Groud, Cl. (2005): “Les prédicats d’<affect>”, in: LIDIL 32, 123-143.
Ces verbes sont classés comme suit: 67 verbes d’affect, 197 verbes causatifs (dégoûter), 101 verbes
pronominaux, soit 365 verbes au total.