La notion de compétence « phraséologique ».
Verbes à haute fréquence et corpus
d’apprenants anglophones avancés
Catherine BOLLY
Université catholique de Louvain, CELEXROM
(Belgique)
Abstract : It is now generally accepted that phraseological units are an
area of great difficulty in second language acquisition, even for
advanced learners (Nesselhauf 2004, 2005). Can one nevertheless
assume that learners acquire such a thing as « phraseological »
competence ? To answer this question, we analyzed 589 verb-noun
(semi) fixed combinations with two high frequency verbs, namely
prendre and donner, taken from a corpus of argumentative texts (190 000
words) produced by advanced English learners of French as a second
language and by French native speakers (180 000 words). In addition to
carrying out a contrastive interlanguage analysis of our learner data
(Granger 1998, 2004), we also used a parametric and statistical method
of data treatment as described in Degand & Bestgen (2004). This
combined method of analysis has allowed us to quantify several
internal and external parameters which are likely to influence the
acquisition of phraseological units.
Key words : contrastive interlanguage analysis, phraseological
competence, high frequency verb, misuse/overuse/underuse.
Résumé : Il est actuellement admis que les unités phraséologiques
constituent des obstacles à l’appropriation d’une langue seconde,
jusqu’à un niveau avancé d’apprentissage (Nesselhauf 2004, 2005). Mais
peut-on pour autant parler d’une compétence « phraséologique » ? Pour
tenter de répondre à cette question, nous avons analysé 589 séquences
(semi) figées construites avec les verbes à haute fréquence prendre et
donner, tirées d’un corpus d’apprenants anglophones avancés du
français langue seconde (190 000 mots) et d’un corpus de français
langue première (180 000 mots). Parallèlement à une analyse contrastive
sur corpus d’apprenants (Granger 1998, 2004), nous avons effectué une
analyse paramétrique et statistique des données de corpus (Degand &
Bestgen 2004). Cette double approche nous a permis de traduire en
termes quantitatifs l’influence de certains facteurs internes et externes
sur la production d’erreurs par l’apprenant avancé.
Mots clés : analyse contrastive interlinguale, compétence
phraséologique, verbe à haute fréquence, mésusage/suremploi/sous-
emploi.
Introduction : méthode et corpus
Il est actuellement admis que les séquences (semi)
figées constituent des obstacles à l’appropriation d’une
langue seconde ou étrangère (Mel’čuk 1993 ; Colson
2000 ; González Rey 2002 : 14), jusqu’à un niveau avancé
d’apprentissage (Nesselhauf 2005 : 2) : « The knowledge
of and the ability to use prefabricated units are [thus]
essential for the language learner ; unfortunately,
however, they also pose considerable difficulties, even
for the advanced learner ». Mais peut-on pour autant
parler d’une compétence « phraséologique » au même
titre que les domaines de fragilité liés aux compétences
syntaxique, lexicale, morphologique, rhétorique ou
discursive (Bartning 1997 ; Bartning & Kirchmeyer 2003 ;
Bartning & Schlyter 2004) ? Et si tel est le cas, quelles
seraient les erreurs spécifiques à ce domaine de
compétence langagière ? Afin de répondre à ces
questions, nous avons adopté une méthode d’analyse de
corpus mixte, où « intuition and data collection work
hand in hand » (Partington 1998 : 1).
Premièrement, nous avons effectué une analyse sur
corpus d’apprenants (Granger 1998, 2004), permettant
d’étudier l’usage de formes natives et non natives d’une
interlangue du français langue étrangère (FL2) en termes
de fréquence (sous-emploi/suremploi), notamment par
rapport à l’usage de ces mêmes formes par des locuteurs
natifs du français (FL1). La démarche adoptée pour tester
notre hypothèse de travail est donc contrastive et
interlangagière. Notre corpus d’étude (190 000 mots) est
tiré du corpus informatisé d’apprenants FRIDA FRench
Interlanguage DAtabase (Cassart et alii 2002). Il relève de la
variété dite « avancée » (VA) du FL2, les apprenants
ayant un niveau d’instruction éle (Bartning 1997) et le
corpus répondant aux facteurs externes qui caractérisent
traditionnellement la variété avancée en recherche
acquisitionnelle : l’acquisition guidée (input par
l’enseignement), l’apprentissage de la langue cible
comme langue étrangère (LS=anglais), les connaissances
métalinguistiques et la scolarisation (cadre institutionnel
universitaire)
1
. Les textes se caractérisent par ailleurs par
leur structure à visée argumentative, qu’il s’agisse de
dissertations à proprement parler ou de textes narratifs,
voire descriptifs. Dans une perspective quasi
longitudinale, nous avons complété notre étude par
l’analyse d’un corpus de FL2 de niveau intermédiaire
(VI) pré-universitaire (50 000 mots). Le corpus de
contrôle en FL1 (180 000 mots) se constitue quant à lui
exclusivement de textes écrits argumentés produits par
des apprenants du français à l’université. Nous avons
extrait de nos corpus de manière semi-automatique
(Oxford WordSmith Tools 4.0) 886 séquences verbo-
nominales (SVN) dont la structure syntaxique est la
suivante :
SVN = N0[SUJ] + V prendre/donner + N1[OBJ] (+ N2[PREP])
D’un point de vue phraséologique, nous avons
concentré notre étude sur les 589 séquences verbo-
nominales semi figées ou figées (S(S)F)
2
construites avec
les verbes à haute fréquence prendre et donner, tirées du
corpus d’apprenants avancés du FL2 (295 occ./190 000
mots) et du corpus de contrôle FL1 (294 occ./180 000
mots).
Tableau 1. Répartition des séquences (semi) figées avec prendre et
donner et nombre de séquences (semi) figées erronées dans les corpus.
1
Nous opérons une distinction entre le niveau dit « avancé »
de la variété d’interlangue étudiée, qui repose sur des
critères externes/extralinguistiques, et le niveau dit
« avancé » des textes d’apprenants pris isolément, qui
repose sur des critères internes/linguistiques. Le corpus
FRIDA, bien qu’hétérogène puisque regroupant des textes
de niveau intermédiaire à avancé, est donc considéré à ce
titre comme représentatif de la variété avancée du FL2.
2
Pour décider de l’appartenance d’une SVN à la catégorie
des séquences libres ou à celle des séquences (semi) figées,
nous nous sommes appuyée principalement sur les tables
des expressions verbales figées élaborées par M. Gross
dans le cadre du Lexique-Grammaire.
FL2 (LS=AN)
VI VA FL1
Corpus de contrôle
50 000
mots
77 textes
190 000
mots
254 textes
180 000 mots
330 textes
prendre 43 occ.
[25 ERR.] 148 occ.
[48 ERR.] 194 occ.
[9 ERR.]
donner 43 occ.
[23 ERR.] 147 occ.
[59 ERR.] 100 occ.
[6 ERR.]
Total 86 occ.
[48 ERR.] 295 occ.
[107 ERR.] 294 occ.
[15 ERR.]
Deuxièmement, une analyse paramétrique et
statistique de nos données de corpus (Degand & Bestgen
2004) a permis de vérifier/infirmer nos hypothèses de
travail par un traitement quantitatif et statistique de ces
données. La systématisation de l’analyse qualitative
passe ainsi par une phase cruciale d’opérationnalisation
des données initiales (Baarda et alii 2004). L’outil
principal de travail pour cette approche paramétrique et
statistique est le logiciel de traitement statistique SPSS
12.0 (Statistical Package for Social Sciences)
3
.
SPSS offre toutes les techniques de statistiques
descriptives nécessaires à la valorisation des données :
classification et description de populations,
regroupement d'individus similaires, tests et détection
de tendances, croisement de critères descriptifs, etc.
Site officiel SPSS (http ://www.spss.com/fr)
Par cette double approche sur corpus d’apprenants
contrastive/interlangagière et paramétrique/statistique –,
nous avons pu observer l’influence de variables externes,
telles que le niveau d’instruction (VI vs VA) ou la langue
source de l’apprenant (FR vs AN), et l’influence de
variables internes, telles que la nature du verbe à haute
fréquence emplo (prendre vs donner) ou le caractère
acceptable de la S(S)F (acceptable vs erroné), sur la
production d’unités phraséologiques verbo-nominales
3
Nous avons également eu recours, mais de manière plus
sporadique, à un outil de statistique en ligne pour le calcul
du Chi carré (http ://www.aly-abbara.com).
par l’apprenant anglophone dans des textes écrits
argumentés.
Phraséologie et séquences (semi) figées
La phraséologie est une discipline linguistique qui
s’intéresse au processus de figement langagier. Elle a
pour objet d’étude les « séquences semi figées » ou
« figées » (S(S)F), appelées aussi « unités
phraséologiques » (UP) : les S(S)F sont des séquences
polylexicales constituées de deux ou plusieurs mots
graphiques catégoriellement liés, contigus ou non, qui co-
apparaissent de manière préférentielle en usage. Une
unité polylexicale se définit traditionnellement comme
une catégorie grammaticale composée de plusieurs mots
(lexèmes) séparés par un blanc (González Rey 2002). Les
unités polylexicales se distinguent des constructions
syntaxiques libres, dont les constituants conservent leur
autonomie syntaxique et sémantique respective, ainsi que
des formes dérivées et fléchies, constituées d’au moins un
morphème non autonome (affixe ou désinence).
Une séquence de plusieurs mots graphiques est dite
« libre » (SL) quand elle ne fait l’objet d’aucune
restriction idiosyncrasique : elle se définit
syntaxiquement par sa flexibilité distributionnelle,
sémantiquement par son caractère compositionnel,
lexicalement par une ouverture des paradigmes,
pragmatiquement par sa liberté d’emploi en situation de
communication. Les (seules) contraintes qui régissent une
SL sont les règles de syntaxe et les règles de restriction de
sélection.
(1) [SL] Si une fabrique s'encrasse l'environement, on donne un
policien une somme d'argent et la fabrique reçoit une
permission et elle peut continuer à s'encrasser
l'environement.
4
(Corpus FL2, occ. 326)
4
Dans les exemples, les caractères gras et les soulignements
sont de nous. Le caractère gras est utilisé pour mettre en
évidence le verbe à haute fréquence et le soulignement
1 / 19 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !