Preprint

publicité
La notion de compétence « phraséologique ».
Verbes à haute fréquence et corpus
d’apprenants anglophones avancés
Catherine BOLLY
Université catholique de Louvain, CELEXROM
(Belgique)
Abstract : It is now generally accepted that phraseological units are an
area of great difficulty in second language acquisition, even for
advanced learners (Nesselhauf 2004, 2005). Can one nevertheless
assume that learners acquire such a thing as « phraseological »
competence ? To answer this question, we analyzed 589 verb-noun
(semi) fixed combinations with two high frequency verbs, namely
prendre and donner, taken from a corpus of argumentative texts (190 000
words) produced by advanced English learners of French as a second
language and by French native speakers (180 000 words). In addition to
carrying out a contrastive interlanguage analysis of our learner data
(Granger 1998, 2004), we also used a parametric and statistical method
of data treatment as described in Degand & Bestgen (2004). This
combined method of analysis has allowed us to quantify several
internal and external parameters which are likely to influence the
acquisition of phraseological units.
Key words : contrastive interlanguage analysis, phraseological
competence, high frequency verb, misuse/overuse/underuse.
Résumé : Il est actuellement admis que les unités phraséologiques
constituent des obstacles à l’appropriation d’une langue seconde,
jusqu’à un niveau avancé d’apprentissage (Nesselhauf 2004, 2005). Mais
peut-on pour autant parler d’une compétence « phraséologique » ? Pour
tenter de répondre à cette question, nous avons analysé 589 séquences
(semi) figées construites avec les verbes à haute fréquence prendre et
donner, tirées d’un corpus d’apprenants anglophones avancés du
français langue seconde (190 000 mots) et d’un corpus de français
langue première (180 000 mots). Parallèlement à une analyse contrastive
sur corpus d’apprenants (Granger 1998, 2004), nous avons effectué une
analyse paramétrique et statistique des données de corpus (Degand &
Bestgen 2004). Cette double approche nous a permis de traduire en
termes quantitatifs l’influence de certains facteurs internes et externes
sur la production d’erreurs par l’apprenant avancé.
Mots clés : analyse contrastive interlinguale, compétence
phraséologique, verbe à haute fréquence, mésusage/suremploi/sousemploi.
Introduction : méthode et corpus
Il est actuellement admis que les séquences (semi)
figées constituent des obstacles à l’appropriation d’une
langue seconde ou étrangère (Mel’čuk 1993 ; Colson
2000 ; González Rey 2002 : 14), jusqu’à un niveau avancé
d’apprentissage (Nesselhauf 2005 : 2) : « The knowledge
of and the ability to use prefabricated units are [thus]
essential for the language learner ; unfortunately,
however, they also pose considerable difficulties, even
for the advanced learner ». Mais peut-on pour autant
parler d’une compétence « phraséologique » au même
titre que les domaines de fragilité liés aux compétences
syntaxique, lexicale, morphologique, rhétorique ou
discursive (Bartning 1997 ; Bartning & Kirchmeyer 2003 ;
Bartning & Schlyter 2004) ? Et si tel est le cas, quelles
seraient les erreurs spécifiques à ce domaine de
compétence langagière ? Afin de répondre à ces
questions, nous avons adopté une méthode d’analyse de
corpus mixte, où « intuition and data collection work
hand in hand » (Partington 1998 : 1).
Premièrement, nous avons effectué une analyse sur
corpus d’apprenants (Granger 1998, 2004), permettant
d’étudier l’usage de formes natives et non natives d’une
interlangue du français langue étrangère (FL2) en termes
de fréquence (sous-emploi/suremploi), notamment par
rapport à l’usage de ces mêmes formes par des locuteurs
natifs du français (FL1). La démarche adoptée pour tester
notre hypothèse de travail est donc contrastive et
interlangagière. Notre corpus d’étude (190 000 mots) est
tiré du corpus informatisé d’apprenants FRIDA – FRench
Interlanguage DAtabase (Cassart et alii 2002). Il relève de la
variété dite « avancée » (VA) du FL2, les apprenants
ayant un niveau d’instruction élevé (Bartning 1997) et le
corpus répondant aux facteurs externes qui caractérisent
traditionnellement la variété avancée en recherche
acquisitionnelle : l’acquisition guidée (input par
l’enseignement), l’apprentissage de la langue cible
comme langue étrangère (LS=anglais), les connaissances
métalinguistiques et la scolarisation (cadre institutionnel
universitaire)1. Les textes se caractérisent par ailleurs par
leur structure à visée argumentative, qu’il s’agisse de
dissertations à proprement parler ou de textes narratifs,
voire descriptifs. Dans une perspective quasi
longitudinale, nous avons complété notre étude par
l’analyse d’un corpus de FL2 de niveau intermédiaire
(VI) pré-universitaire (50 000 mots). Le corpus de
contrôle en FL1 (180 000 mots) se constitue quant à lui
exclusivement de textes écrits argumentés produits par
des apprenants du français à l’université. Nous avons
extrait de nos corpus de manière semi-automatique
(Oxford WordSmith Tools 4.0) 886 séquences verbonominales (SVN) dont la structure syntaxique est la
suivante :
SVN = N0[SUJ] + V prendre/donner + N1[OBJ] (+ N2[PREP])
D’un point de vue phraséologique, nous avons
concentré notre étude sur les 589 séquences verbonominales semi figées ou figées (S(S)F)2 construites avec
les verbes à haute fréquence prendre et donner, tirées du
corpus d’apprenants avancés du FL2 (295 occ./190 000
mots) et du corpus de contrôle FL1 (294 occ./180 000
mots).
Tableau 1. Répartition des séquences (semi) figées avec prendre et
donner et nombre de séquences (semi) figées erronées dans les corpus.
1
2
Nous opérons une distinction entre le niveau dit « avancé »
de la variété d’interlangue étudiée, qui repose sur des
critères externes/extralinguistiques, et le niveau dit
« avancé » des textes d’apprenants pris isolément, qui
repose sur des critères internes/linguistiques. Le corpus
FRIDA, bien qu’hétérogène puisque regroupant des textes
de niveau intermédiaire à avancé, est donc considéré à ce
titre comme représentatif de la variété avancée du FL2.
Pour décider de l’appartenance d’une SVN à la catégorie
des séquences libres ou à celle des séquences (semi) figées,
nous nous sommes appuyée principalement sur les tables
des expressions verbales figées élaborées par M. Gross
dans le cadre du Lexique-Grammaire.
prendre
donner
Total
FL2 (LS=AN)
VI
VA
50 000
190 000
mots
mots
77 textes
254 textes
43 occ.
148 occ.
[25 ERR.]
[48 ERR.]
43 occ.
147 occ.
[23 ERR.]
[59 ERR.]
86 occ.
295 occ.
[48 ERR.]
[107 ERR.]
FL1
Corpus de contrôle
180 000 mots
330 textes
194 occ.
[9 ERR.]
100 occ.
[6 ERR.]
294 occ.
[15 ERR.]
Deuxièmement, une analyse paramétrique et
statistique de nos données de corpus (Degand & Bestgen
2004) a permis de vérifier/infirmer nos hypothèses de
travail par un traitement quantitatif et statistique de ces
données. La systématisation de l’analyse qualitative
passe ainsi par une phase cruciale d’opérationnalisation
des données initiales (Baarda et alii 2004). L’outil
principal de travail pour cette approche paramétrique et
statistique est le logiciel de traitement statistique SPSS
12.0 (Statistical Package for Social Sciences)3.
SPSS offre toutes les techniques de statistiques
descriptives nécessaires à la valorisation des données :
classification
et
description
de
populations,
regroupement d'individus similaires, tests et détection
de tendances, croisement de critères descriptifs, etc.
Site officiel SPSS (http ://www.spss.com/fr)
Par cette double approche sur corpus d’apprenants –
contrastive/interlangagière et paramétrique/statistique –,
nous avons pu observer l’influence de variables externes,
telles que le niveau d’instruction (VI vs VA) ou la langue
source de l’apprenant (FR vs AN), et l’influence de
variables internes, telles que la nature du verbe à haute
fréquence employé (prendre vs donner) ou le caractère
acceptable de la S(S)F (acceptable vs erroné), sur la
production d’unités phraséologiques verbo-nominales
3
Nous avons également eu recours, mais de manière plus
sporadique, à un outil de statistique en ligne pour le calcul
du Chi carré (http ://www.aly-abbara.com).
par l’apprenant anglophone dans des textes écrits
argumentés.
Phraséologie et séquences (semi) figées
La phraséologie est une discipline linguistique qui
s’intéresse au processus de figement langagier. Elle a
pour objet d’étude les « séquences semi figées » ou
« figées »
(S(S)F),
appelées
aussi
« unités
phraséologiques » (UP) : les S(S)F sont des séquences
polylexicales constituées de deux ou plusieurs mots
graphiques catégoriellement liés, contigus ou non, qui coapparaissent de manière préférentielle en usage. Une
unité polylexicale se définit traditionnellement comme
une catégorie grammaticale composée de plusieurs mots
(lexèmes) séparés par un blanc (González Rey 2002). Les
unités polylexicales se distinguent des constructions
syntaxiques libres, dont les constituants conservent leur
autonomie syntaxique et sémantique respective, ainsi que
des formes dérivées et fléchies, constituées d’au moins un
morphème non autonome (affixe ou désinence).
Une séquence de plusieurs mots graphiques est dite
« libre » (SL) quand elle ne fait l’objet d’aucune
restriction
idiosyncrasique
:
elle
se
définit
syntaxiquement par sa flexibilité distributionnelle,
sémantiquement par son caractère compositionnel,
lexicalement par une ouverture des paradigmes,
pragmatiquement par sa liberté d’emploi en situation de
communication. Les (seules) contraintes qui régissent une
SL sont les règles de syntaxe et les règles de restriction de
sélection.
(1)
4
[SL] Si une fabrique s'encrasse l'environement, on donne un
policien une somme d'argent et la fabrique reçoit une
permission et elle peut continuer à s'encrasser
l'environement.4 (Corpus FL2, occ. 326)
Dans les exemples, les caractères gras et les soulignements
sont de nous. Le caractère gras est utilisé pour mettre en
évidence le verbe à haute fréquence et le soulignement
Par contraste, les S(S)F sont marquées par un haut
degré de collocabilité, le principe de collocabilité se
définissant comme la « tendance syntactico-sémantique
des mots à entrer en combinaison avec d’autres termes,
en nombre limité parmi une grande quantité de
combinaisons possibles » (González Rey 2002 : 65-66). A
l’instar de Lamiroy (2003) et Svensson (2004), nous
retenons trois critères linguistiques définitoires des S(S)F,
en tant qu’elles se caractérisent de manière non exclusive
par
- un certain degré de fixité syntaxique (blocage des
propriétés transformationnelles et ordre des
constituants inaltérable) ; et/ou
- un certain degré d’opacité sémantique (noncompositionnalité au moins partielle) ; et/ou
- un certain degré de restriction lexicale (blocage
paradigmatique).
Nous comprenons par fixité syntaxique un certain
degré de contrainte sur l’ordre des constituants et de
blocage des propriétés transformationnelles d’une
séquence donnée. « Une séquence est figée du point de
vue syntaxique quand elle refuse toutes les possibilités
combinatoires ou transformationnelles qui caractérisent
habituellement une suite de ce type » (G. Gross 1996 :
154). La fixité se définit par opposition à la syntaxe libre
des SL qui sont dites « flexibles ». L’opacité est quant à
elle un des traits du figement le plus généralement
reconnu par les chercheurs en phraséologie. Une
séquence « est figée sémantiquement quand le sens est
opaque ou non compositionnel, c’est-à-dire quand il ne
peut pas être déduit du sens des éléments composants »
(G. Gross 1996 : 154). Les mécanismes de figuration
tropique par métaphore/métonymie jouent souvent un
rôle important dans ce processus d’opacification. Enfin,
les S(S)F se caractérisent par une contrainte opérant sur
les possibilités de substitution synonymique des
paradigmes ou, en d’autres termes, par un certain degré
pour mettre en relief
compléments du verbe.
les
syntagmes
nominaux
de restriction lexicale ou de « blocage des paradigmes
synonymiques » (G. Gross 1996 : 17-18). Nous adoptons
donc une définition pluridimensionnelle et scalaire du
figement, allant des constructions les plus libres aux plus
figées. Une étude pilote5 menée sur le degré de figement
de 200 SVN construites avec le verbe prendre en FL1
(Bolly à paraître), a ainsi mis en évidence la forte
corrélation (ρ = 0,411 à 0,487, p = 0,000) existant entre les
trois critères linguistiques de figement, à savoir la fixité
syntaxique, l’opacité sémantique et la restriction lexicale.
Les résultats montrent que plus il y a de contraintes
combinées au sein d’une même SVN, plus le degré de
figement global de cette séquence est élevé. Les exemples
de S(S)F repris ci-dessous comportent une indication
quant au degré de figement global de la S(S)F en cotexte,
allant du plus libre au plus figé (SSF- → SSF+ → SF).6
(2)
[SSF-] Rêve qui prit des allures sérieuses, lorsqu' en 1951, la
Belgique, l' ancienne République fédérale d' Allemagne, la
France, l' Italie et les Pays-bas, signèrent le traité instaurant
la communauté européenne du charbon et de l' acier. (Corpus
FL1, occ. 591)
(3)
[SSF+] je veux dire qu'il a prit connaissance de ses emotions
et peut donc les controler (Corpus FL1, occ. 133)
(4)
[SF] nous ne sommes pas tous président, ministre où
professeur français qui prennent la grande part du gâteau.
(FL2, occ. 69)
Par ailleurs, certaines S(S)F appartiennent à une
catégorie spécifique à l’interlangue d’apprenants : elles
se caractérisent par leur forme déviante et ne
5
6
Le corpus utilisé pour cette étude se constitue d’ 1 million
de mots en français langue première (français de
Belgique et français de France) et comprend des textes de
presse écrite, des textes littéraires narratifs et
dramaturgiques, des textes oraux et des textes
argumentatifs.
Pour une analyse détaillée du degré de figement des SVN
avec prendre en termes de critères syntaxiques, sémantiques
et lexicaux, nous renvoyons à l’article précité (Bolly à
paraître).
correspondent à aucune S(S)F normée repérable dans
l’usage en FL1. Nous les avons regroupées sous la
catégorie
des
SPILI
(Séquences
Préfabriquées
Interlangagières Intérimaires, Forsberg à paraître).
(5)
[SPILI] Pour entamer le sujet d'immigration en France, il
faut d'abord donner une brève histoire de l'immigration en
France (FL2, occ. 492)
Analyse contrastive : les séquences (semi) figées
dans un corpus d’apprenants anglophones du
français langue seconde
Dans leur article sur le verbe à haute fréquence make,
Altenberg & Granger (2001) mettent en exergue la
coexistence de résultats de recherche a priori
contradictoires concernant l’usage des verbes à haute
fréquence (VHF) par des apprenants de l’anglais langue
étrangère. Alors que les premiers résultats tendent à
démontrer un suremploi des VHF par l’apprenant
(Hasselgren 1994 ; Källvist 1999), les seconds mettent en
évidence une tendance au sous-emploi de ces VHF
(Sinclair 1991). Le suremploi de ces verbes serait lié à
divers facteurs (Altenberg & Granger 2001 : 174) : leur
apprentissage précoce dans le curriculum acquisitionnel,
la richesse de leurs possibilités d’emploi, ainsi que
l’influence du transfert positif entre des langues proches.
Le sous-emploi serait dû quant à lui principalement à des
stratégies d’évitement, les VHF étant souvent constitutifs
de constructions « délexicales », c’est-à-dire de
constructions verbo-nominales à verbe support. En
d’autres termes, le sous-emploi des VHF par l’apprenant
serait dû à une stratégie d’évitement mise en place pour
contourner la difficulté des emplois phraséologiques de
ces verbes.
Sous-emploi des séquences (semi) figées et
suremploi des séquences libres par l’apprenant du
FL2
Suite au double constat fait par Altenberg & Granger
(2001), nous émettons une première hypothèse
concernant les deux VHF prendre et donner en FL2, en
termes de suremploi/sous-emploi, dans une perspective
spécifiquement phraséologique. Cette hypothèse tient
compte, d’une part, des stratégies d’évitement mises en
place par l’apprenant du FL2 pour les emplois
phraséologiques des VHF (cf. ci-dessus) et, d’autre part,
de l’apprentissage tardif des unités phraséologiques dans
le curriculum acquisitionnel.
Hypothèse 1
La fréquence des S(S)F produites par les locuteurs natifs
(LN) du français serait plus élevée que celle des S(S)F
produites par les locuteurs non natifs (LNN) du français.
Autrement dit, il y aurait un sous-emploi des S(S)F avec
les verbes prendre et donner par les apprenants
anglophones avancés du FL2, en situation de production
écrite argumentée.
Suite à l’examen de nos données quantitatives (Cf.
Tableau 2, ci-dessous), nous observons que la proportion
d’emplois des S(S)F est aussi importante chez les LN que
chez les LNN (> 70%), ce qui traduit une tendance des
natifs comme des non natifs à l’emploi fréquent de S(S)F,
par opposition à l’emploi de SL. Notons toutefois que le
LN produit légèrement plus d’unités phraséologiques
(82,6%) que le LNN (70,9%).
Tableau 2. Influence de la langue source de l’apprenant sur la
production de SVN libres vs (semi) figées (test statistique du Chi
carré).
FL2/VA
FL1
Total
SL
121
29,1%
62
17,4%
183
S(S)F
295
70,9%
294
82,6%
589
Total
416
100,0%
356
100,0%
772
Χ2
Χ2 = 14,448
ddl = 1
p = 0,000*
D’un point de vue statistique, nous avons pu
observer que le nombre d’unités phraséologiques
produites (vs le nombre de séquences libres) variait de
manière significative7 (Χ2 = 14,448, ddl = 1, p = 0,000) en
fonction de la langue source de l’apprenant. Dans un
premier temps, ces résultats appuient la première
constatation faite par Altenberg & Granger (2001) sur
l’emploi des VHF par l’apprenant d’une L2 : il y a
suremploi des SVN avec prendre et donner chez les
apprenants anglophones (416 occ.) par rapport aux
francophones natifs (356 occ.). Dans un second temps,
alors que le nombre d’occurrences (semi) figées est
équivalent chez le LNN et le LN (295 et 294 occ.), le LNN
produit deux fois plus de SVN libres (121 occ.) que le LN
(62 occ.). Nous constatons donc que le phénomène de
suremploi des VHF par les apprenants anglophones
avancés est en fait lié à un suremploi des SL, et non à un
sous-emploi des unités phraséologiques par ces mêmes
apprenants du FL2.
Sous-emploi des séquences (semi) figées avec
prendre vs suremploi des séquences (semi) figées
avec donner par l’apprenant du FL2
A partir de ces résultats globaux, nous formulons
une seconde hypothèse tenant compte des éventuelles
caractéristiques propres à chacun des VHF prendre et
donner.
Hypothèse 2
De par leurs spécificités linguistiques, il y aurait une
différence de fréquence en FL2 entre les S(S)F avec
prendre et celles avec donner. Cette différence serait
traductible en termes de suremploi/sous-emploi.
Tableau 3. Influence de la langue source de l’apprenant sur la
production de S(S)F avec prendre vs donner (test statistique du Chi
carré).
7
Les résultats statistiques par croisement en Chi carré ont
été considérés comme étant significatifs quand le
coefficient de contingence (p) était inférieur ou égal à 0,05.
Les résultats statistiquement significatifs sont marqués par
un astérisque (*) dans les tableaux.
SSF
Prendre
Donner
Total
Χ2
FL2/VA
148
50,2%
147
49,8%
295
100%
FL1
194
66%
100
34%
294
100%
Χ2 = 15,129
ddl = 1
p = 0,000*
Total
342
247
589
Selon les résultats statistiques obtenus, la différence
d’emploi des S(S)F construites avec prendre et donner, en
FL2 vs FL1, est hautement significative (Χ2 = 15,129, ddl =
1, p = 0,000). En effet, alors qu’en FL1 la proportion de
S(S)F construites avec prendre représente 2/3 des S(S)F
pour 1/3 seulement avec donner, l’apprenant anglophone
avancé du FL2 produit autant de S(S)F avec prendre
(50,2%) qu’avec donner (49,8%). Ces résultats très
significatifs traduisent donc une tendance des apprenants
anglophones avancés du FL2 au suremploi des S(S)F avec
le verbe donner et un sous-emploi des S(S)F avec le verbe
prendre. Comment expliquer cette différence ? Nous
proposons ici plusieurs explications liées à la spécificité
du système linguistique de chacun de ces VHF : une
différence de système flexionnel, leur caractère plus ou
moins polysémique, leur comportement plus ou moins
phraséologique. Du point de vue flexionnel, par exemple,
nous pouvons supposer que la régularité de la
conjugaison du verbe donner (en –ER) engendrerait un
emploi plus aisé, voire un suremploi, de ce VHF par
l’apprenant du FL2. Par opposition, l’irrégularité de la
conjugaison du verbe prendre favoriserait la stratégie
d’évitement et le sous-emploi des S(S)F qui le
contiennent. Ces explications demandent toutefois à être
vérifiées dans une phase ultérieure de recherche.
Mésusage des S(S)F par l’apprenant en FL2 et FL1 :
acquisition d’une compétence phraséologique
Le caractère acceptable ou erroné des S(S)F a été
déterminé par le biais d’un test d’élicitation inter-juges (8
locuteurs francophones natifs, dont 4 spécialistes de la
langue française). Les résultats de ce test rendent compte
du degré d’acceptabilité de chacune des séquences
étudiées en cotexte, sur une échelle allant du moins
acceptable ou plus acceptable (de 1 à 5). Quand l’énoncé
était jugé inacceptable (valeurs 1 à 2), il était demandé au
juge de localiser l’origine présumée de l’erreur. L’étude
sur l’appartenance des S(S)F à une norme langagière et
sur le caractère attesté de ces formes en usage s’est basée
sur l’examen des Tables de M. Gross précitées et,
uniquement en cas de doute, nous avons eu recours au
moteur de recherche Google.fr et au concordanceur en
ligne Glossanet (Fairon 1999). Notre analyse contrastive
des erreurs produites par les apprenants du FL2 est
formulée sous l’hypothèse suivante :
Hypothèse 3
Le niveau d’interlangue des apprenants aurait une
influence sur la fréquence des erreurs portant sur les
S(S)F. Plus précisément, la fréquence décroissante
d’erreurs portant sur les S(S)F irait de pair avec le niveau
d’acquisition grandissant des apprenants.
Pour tester l’influence du niveau d’acquisition de
l’apprenant (variable ordinale) sur l’acceptabilité de la
S(S)F (variable nominale), nous avons procédé au test de
Mann-Whitney (Cf. Tableau 4, ci-dessous). La différence
statistique est très significative (U = 20518,5, p = 0,000) :
plus la variété d’interlangue est avancée, plus les S(S)F
sont acceptables (Rang moyen 382,37), et inversement
pour les S(S)F erronées (Rang moyen 206,20). La même
comparaison envisagée sous l’angle d’un croisement
entre variables nominales, en l’occurrence la catégorie
d’interlangue et la (non) acceptabilité des S(S)F), montre
un résultat également très significatif (Χ2 = 49,482, ddl = 2,
p < 0,001).
Tableau 4. Fréquences relatives des S(S)F acceptables/erronées dans
les interlangues : variété intermédiaire du FL2 (VI), variété avancée
du FL2 (VA) et corpus natif du FL1.
n /50 000
mots
S(S)F
acceptables
S(S)F
erronées
Total
FL2/VI
FL2/VA
FL1
Total
Statistiques
38
49,4
77,5
164,9
48
28,2
4,2
80,4
86
77,6
81,7
245,3
Test de MannWhitney
U = 20518,5,
p = 0,000*
Test du Chi
carré
Χ2 = 49,482,
ddl = 2,
p < 0,001*
Ces résultats confirment que l’acceptabilité des S(S)F
construites avec les VHF prendre et donner dépend
fortement du niveau d’acquisition de l’apprenant.
Autrement dit, il y a bien une progression vers une
acquisition de la compétence « phraséologique » et, plus
spécialement, vers une compétence de production des
S(S)F avec prendre et donner à l’écrit argumenté par les
apprenants anglophones avancés du FL2.
Mésusage des S(S)F par l’apprenant du FL2 :
fréquence et types d’erreurs spécifiques aux verbes
prendre vs donner
S’il y a bien une compétence « phraséologique »,
quelles seraient les erreurs les plus fréquentes ou
spécifiques à la variété avancée du FL2 ? Les types
d’erreurs sont-ils spécifiques aux verbes prendre vs
donner ?
Hypothèse 4
La fréquence et le type d’erreurs produites en FL2
varieraient en fonction du VHF (prendre vs donner) de la
S(S)F.
Pour tester cette hypothèse, nous avons d’une part
examiné la proportion d’erreurs commises dans les S(S)F
par l’apprenant avancé en FL2 (vs FL1) et, d’autre part, la
proportion d’erreurs en FL2 portant sur les S(S)F avec
prendre par opposition aux S(S)F avec donner. Or, alors
que la proportion des S(S)F erronées chez le LN est
sensiblement la même pour les deux verbes (± 5%), la
proportion d’erreurs chez le LNN est un peu plus élevée
avec donner (40,1%) qu’avec prendre (32,4%). Mais cette
légère différence au sein de la variété avancée du FL2 estelle pour autant statistiquement significative ? Comme
l’indiquent les résultats statistiques (Cf. Tableau 5), la
nature du VHF utilisé par le LNN dans les S(S)F
n’influence pas de manière significative (p > 0,10) le
caractère acceptable ou erroné de cette S(S)F.
Tableau 5. Influence du type de verbe à haute fréquence sur
l’acceptabilité des S(S)F produites par les apprenants du FL2-VA (test
statistique du Chi carré).
FL2/VA
Prendre
Donner
Total
S(S)F
erronée
48
59
107
S(S)F
acceptable
100
88
188
Total
S(S)F
148
147
295
Χ2
Χ2 = 1,893
ddl = 1
p > 0,10
Quant à la spécificité des erreurs produites par
l’apprenant anglophone avancé du FL2, nous retiendrons
premièrement que ce sont les erreurs portant sur le verbe
(Ex. 6) ou sur la SVN prise dans sa totalité (Ex. 7) qui sont
les plus fréquentes : 1/3 des constituants verbaux et 1/3
des SVN sont employés erronément dans les unités
phraséologiques.
(6)
Je *[donnai] un coup d'oeil à ma amie (FL2, occ. 344) →
[jetai]
(7)
Je vous promets que l'assainaissement *[prendre place
comme] un issu d'urgence. (FL2, occ. 117) → [tiendra lieu
de]
Viennent ensuite les erreurs portant sur le
déterminant de l’élément nominal postverbal avec 1/5
des emplois erronés dans les unités phraséologiques.
(8)
Dans le cas de « l'ours » l'auteur veut donner *[de
l']information afin de provoquer une reaction. (FL2, occ. 355)
→ [des]
Par ailleurs, les résultats statistiques (Χ2 = 5,793, ddl =
1, p < 0,02) montrent une forte influence du type de VHF
utilisé par l’apprenant du FL2 (prendre vs donner) sur
l’emploi erroné du constituant verbal des S(S)F : 61% des
erreurs portant sur le verbe sont commises avec le verbe
prendre pour 39% des erreurs sur le verbe avec donner. On
observe également une différence très significative
concernant les erreurs portant sur le syntagme nominal
postverbal prépositionnel (Χ2 = 8,974, ddl = 1, p < 0,01) :
la totalité des erreurs de ce type concerne les S(S)F avec le
verbe donner 8.
(9)
Premièrement les Français ne pouvaient pas planifier leur vie
pendant la guerre donc ils ont décidé de donner naissance
*[∅] sans penser aux conséquences. (FL2, occ. 507) → [à
NHumain]
Conclusion : la notion de compétence
« phraséologique » chez l’apprenant anglophone
avancé du FL2
Nous avons étudié dans cet article la notion de
compétence « phraséologique » en formulant des
hypothèses qui ont été testées quantitativement et
statistiquement par le biais d’une analyse sur corpus
d’apprenants. Certains facteurs externes et internes,
comme la L1 de l’apprenant, le niveau d’acquisition de
celui-ci ou le type de verbe à haute fréquence (VHF)
employé, ont été explorés dans cette étude. Ces facteurs
affectent en effet la production d’unités phraséologiques
(vs libres) par l’apprenant, mais aussi la production
d’erreurs spécifiques à ce type d’unités. Les conclusions
qui peuvent être tirées de cette étude contrastive se
limitent cependant au champ d’étude du FL2 et
concernent uniquement les apprenants anglophones, en
situation de production écrite de textes argumentés, dans
un cadre institutionnel universitaire.
En résumé, les résultats obtenus ont montré que les
apprenants anglophones avancés du FL2 suremployaient
les séquences verbo-nominales (SVN) libres construites
avec les VHF prendre ou donner (Cf. Hypothèse 1). Le
8
Ce résultat est cependant à relativiser puisque l’effectif des
erreurs portant sur le SN prépositionnel des S(S)F avec le
verbe prendre est nul.
sous-emploi d’unités phraséologiques n’a pas été
démontré à ce stade. Mais en étudiant de plus près la
fréquence des séquences (semi) figées (S(S)F) avec prendre
par opposition à celles avec donner, nous avons mis en
évidence un sous-emploi des S(S)F avec prendre et un
suremploi des S(S)F avec donner (Cf. Hypothèse 2). Les
deux verbes, bien qu’étant tous les deux des verbes à
haute fréquence à haut potentiel phraséologique, se
différencient donc pourtant l’un de l’autre dans les
productions des apprenants anglophones. Il serait par
conséquent très intéressant, suite à cette analyse à visée
descriptive, d’étudier ce phénomène d’un point de vue
explicatif : la richesse plus ou moins polysémique des
deux verbes ou leur système flexionnel plus ou moins
complexe auraient-ils une influence sur d’éventuelles
stratégies
d’évitement
(sous-emploi)
ou
de
surgénéralisation
(suremploi)
des
emplois
phraséologiques par l’apprenant ?
Ensuite, nous avons montré qu’il y avait bien une
évolution de l’apprenant anglophone avancé du FL2 vers
l’acquisition d’une compétence « phraséologique » (Cf.
Hypothèse 3). Suite à ce constat, nous avons examiné les
erreurs faites par les apprenants dans les unités
phraséologiques qu’ils produisaient (Cf. Hypothèse 4).
Nous avons ainsi mis en exergue le fait que le type de
VHF dans une S(S)F n’influençait pas de manière
significative le caractère acceptable ou erroné de cette
S(S)F. Une étude de fréquence sur les types d’erreurs
dans les S(S)F nous a révélé que les erreurs portant sur
l’élément verbal ou sur toute la séquence verbo-nominale
étaient proportionnellement les plus importantes.
Viennent ensuite les erreurs portant sur le déterminant.
Considérant les emplois phraséologiques où c’est
l’emploi verbal qui est erroné, nous avons vu que la
différence entre les erreurs produites avec le verbe
prendre et celles produites avec le verbe donner était très
significative : l’apprenant avancé anglophone du FL2
éprouverait plus de difficulté à produire correctement
des S(S)F avec le verbe prendre qu’avec le verbe donner, en
ce qui concerne le choix du constituant verbal correct.
Pour affiner ces résultats, nous envisageons dans un
premier temps d’explorer les hypothèses explicatives
précitées, à savoir le caractère plus ou moins
polysémique des deux verbes et leur système flexionnel.
Dans un second temps, nous nous proposons de
prolonger nos recherches en étudiant l’influence du
degré de variabilité/flexibilité des S(S)F en usage (FL1)
sur la production d’erreurs en FL2. Enfin, une étude sur
corpus de textes d’apprenants néerlandophones avancés
du FL2 permettrait de mieux cerner les spécificités de la
variété d’interlangue dite « avancée » du FL2, mais aussi
de déterminer les spécificités liées à chacun des groupes
d’apprenants en fonction de sa L1.
Bibliographie
ALTENBERG, B., GRANGER, S. (2001) : « The Grammatical
and Lexical Patterning of MAKE in Native and Non-native
Student Writing », Applied Linguistics, 22/2 ; 173-194.
BAARDA, D.B., de GOEDE, M.P.M., van DIJKUM, C.J. (2004) :
Introduction to Statistics with SPSS – A guide to the processing,
analysing and reporting of (research) data. Groningen/Houten
(The Netherlands) : Wolters-Noordhoff.
BARTNING, I. (1997) : « L’apprenant dit avancé et son
acquisition d’une langue étrangère – Tour d’horizon et
esquisse d’une caractérisation de la variété avancée »,
AILE, 9 ; 9-50.
BARTNING, I., KIRCHMEYER, N. (2003) : « Le développement
de la compétence textuelle à travers les stades
acquisitionnels en français L2 », AILE, 19 ; 9-39.
BARTNING, I., SCHLYTER, S. (2004) : « Itinéraires
acquisitionnels et stades de développement en français
L2 », French Language Studies, 14 ; 281-299.
BOLLY, C. (à paraître) : « Au seuil du figement. Séquences
(semi) figées avec le verbe à haute fréquence prendre en FL1
et FL2 », in BOLLY, C., LAMIROY, B., KLEIN, J.R. (éds) : La
Phraséologie dans tous ses états. Théorie et application.
Louvain-la-Neuve (Belgique), 13-15 octobre 2005. Louvainla-Neuve : Cahiers de l’Institut de Linguistique de Louvain.
CASSART, A. et alii (éds) (2002) : Free Text – Deliverable 15, Three
Error-Coded Corpora. Louvain-la-Neuve : UCL/Centre for
English Corpus Linguistics.
COLSON, J.-P. (2000) : « Les locutions verbales françaises et
allemandes dans le discours journalistique : pistes de
recherche, fausses pistes, pistes brouillées (I. Pistes pour le
français) », in GRECIANO, G. (éd.) : Micro- et macrolexèmes
et leur figement discursif. Louvain-Paris : Peeters ; 173-199.
DEGAND, L., BESTGEN, Y. (2004) : « Connecteurs et analyses
de corpus : de l’analyse manuelle à l’analyse automatisée »,
in PORHIEL, S., KLINGLER, D. (éds) : L’Unité texte (Actes
du colloque ‘Regards croisés sur l’Unité texte/Conjoint
Perspectives on Text). Chypre, 18- 20 mars 2004 ; 49-73.
FAIRON, C. (1999) : « Parsing a Web Site as a Corpus », in
FAIRON, C. (éd.) : Analyse lexicale et syntaxique : le système
INTEX, Lingvisticae Investigationes, XXII (Volume spécial).
Amsterdam/Philadelphia : John Benjamins.
FORSBERG, F. (à paraître) : « “Prêt-à-parler”. Les séquences
préfabriquées en français parlé L2 et L1 », in BOLLY, C.,
LAMIROY, B., KLEIN, J.R. (éds) : La Phraséologie dans tous
ses états. Théorie et application. Louvain-la-Neuve (Belgique),
13-15 octobre 2005. Louvain-la-Neuve : Cahiers de l’Institut
de Linguistique de Louvain.
GONZÁLEZ REY, I. (2002) : La phraséologie du français.
Toulouse : Presses universitaires du Mirail.
GRANGER, S. (1998) : « The computer learner corpus : a
versatile new source of data for SLA research », in
GRANGER, S. (éd.) : Learner English on Computer.
London/New York : Longman ; 3-18.
GRANGER, S. (2004) : « Computer Learner Corpus Research :
Current Status and Future Prospects », in CONNOR, U.,
UPTON, T. (éds) : Applied Corpus Linguistics : A
Multidimensional Perspective. Amsterdam/Atlanta : Rodopi ;
123-145.
GROSS, G. (1996) : Les expressions figées en français – Noms
composés et autres locutions. Paris : Ophrys.
LAMIROY, B. (2003) : « Les notions linguistiques de figement et
de contrainte », Actes du colloque rendant hommage à Maurice
Gross. Paris (France), 3 juin 2002. Linguisticae Ivestigationes,
26/1 ; 1-14.
MEL’CUK, I. (1993) : « La phraséologie et son rôle dans
l’enseignement/apprentissage d’une langue étrangère »,
Revue de Linguistique Appliquée, 92 ; 82-113.
NESSELHAUF, N. (2004) : « How learner corpus analysis can
contribute to language teaching : A study of support verb
constructions », in ASTON, G., BERNARDINI, S.,
STEWART, D. (éds) : Corpora and Language Learners.
Philadelphia/Amsterdam : John Benjamins/Studies in
Corpus Linguistics ; 109-124.
NESSELHAUF, N. (2005) : Collocations in a Learner Corpus.
Amsterdam/Philadelphia : John Benjamins.
PARTINGTON, A. (1998) : Patterns and Meanings – Using
Corpora for English Language Research and Teaching.
Philadelphia/Amsterdam : John Benjamins/Studies in
Corpus Linguistics.
SVENSSON, M. H. (2004) : Critères de figement – L'identification
des expressions figées en français contemporain. Umeå
university (Suède) : Institutionen för Moderna Språk
Publikationer.
Sites Internet et ressources informatiques :
Glossanet, concordanceur en ligne :
[http://glossa.fltr.ucl.ac.be]
Outil de statistique en ligne pour le calcul du Khi-carré :
[http://www.aly-abbara.com]
Oxford WordSmith Tools 4.0. Site officiel de Mike Scott :
[http://www.lexically.net]
SPSS – Statistical Package for Social Sciences. Site officiel SPSS :
[http://www.spss.com/fr]
Contact et remerciement
Courrier électronique de l’auteur : [email protected]
Ce travail s’inscrit dans le cadre d’une recherche financée par le projet d’ « Action de
recherche concertée » du Gouvernement de la Communauté française de Belgique.
Le champ d’étude de ce projet collectif, intitulé Foreign Language Learning :
Phraseology and Discourse (ARC 03/08-301), est l’appropriation des langues
étrangères (français, néerlandais et anglais) d’un point de vue phraséologique et
discursif, essentiellement en situation de production écrite.
Téléchargement