
5
La capacité d’un mot à créer des syntagmes qui forment des groupes habituels
constitue en effet un aspect important dans les études d’une langue. Chaque langue a
ses spécificités et ses régularités et irrégularités. Afin de produire une langue la plus
naturelle possible quand on la parle, il est important d’étudier, ou du moins de
comprendre ces variations d’usage, car celles-ci constituent une partie essentielle
dans l’apprentissage de la langue. Afin d’étudier ces variations nous avons besoin de
l’usage attesté. C’est pour cette raison que l’outil très important de notre recherche
est le corpus estfra. Ce corpus nous permettra observer les variations syntaxiques
mais aussi sémantiques dont qu’il peut témoigner dans l’usage d’un mot. Du point de
vue syntaxique, s’il y a des récurrences dans des variations et cela permet de mieux
comprendre l’usage ordinaire, mais aussi de cerner des figements éventuels.
Or, ce qui rend le mot plaisir encore plus intéressant à étudier, c’est le fait qu’il peut
non seulement offrir des variations intéressantes du point de vue syntaxique mais
aussi qu’il existe des récurrences sémantiques à l’intérieur des groupes formées du
point de vue syntaxique. L’étude du voisinage syntaxique du mot nous parlera alors
de même de la sémantique des constructions où il se trouve. L’étude des traductions
nous aidera à compléter notre analyse et contribuera à notre compréhension du
comportement sémantique des constructions variables.
Corpus
Notre corpus d’étude est formé à la base du Corpus parallèle estonien-français de
l'Association franco-estonienne de lexicographie en ligne (http://corpus.estfra.ee). Ce
corpus contient des traductions et des originaux de différents types de textes :
littérature estonienne (3,85 millions de mots), littérature française (4,09 millions de
mots), textes non littéraires estoniens (132 000 mots), textes non littéraires français
(990 000 mots), législation européenne (26,3 millions de mots), débats du Parlement
européen (28,2 millions de mots) et Bible (1,4 million de mots). A partir de ce corpus
de référence, nous avons formé un corpus d’étude en ne choisissant que des textes de
la littérature française traduits en estonien.