La notion de compétence « phraséologique ». Verbes à haute fréquence et corpus d’apprenants anglophones avancés Catherine BOLLY Université catholique de Louvain, CELEXROM (Belgique) Abstract : It is now generally accepted that phraseological units are an area of great difficulty in second language acquisition, even for advanced learners (Nesselhauf 2004, 2005). Can one nevertheless assume that learners acquire such a thing as « phraseological » competence ? To answer this question, we analyzed 589 verb-noun (semi) fixed combinations with two high frequency verbs, namely prendre and donner, taken from a corpus of argumentative texts (190 000 words) produced by advanced English learners of French as a second language and by French native speakers (180 000 words). In addition to carrying out a contrastive interlanguage analysis of our learner data (Granger 1998, 2004), we also used a parametric and statistical method of data treatment as described in Degand & Bestgen (2004). This combined method of analysis has allowed us to quantify several internal and external parameters which are likely to influence the acquisition of phraseological units. Key words : contrastive interlanguage analysis, phraseological competence, high frequency verb, misuse/overuse/underuse. Résumé : Il est actuellement admis que les unités phraséologiques constituent des obstacles à l’appropriation d’une langue seconde, jusqu’à un niveau avancé d’apprentissage (Nesselhauf 2004, 2005). Mais peut-on pour autant parler d’une compétence « phraséologique » ? Pour tenter de répondre à cette question, nous avons analysé 589 séquences (semi) figées construites avec les verbes à haute fréquence prendre et donner, tirées d’un corpus d’apprenants anglophones avancés du français langue seconde (190 000 mots) et d’un corpus de français langue première (180 000 mots). Parallèlement à une analyse contrastive sur corpus d’apprenants (Granger 1998, 2004), nous avons effectué une analyse paramétrique et statistique des données de corpus (Degand & Bestgen 2004). Cette double approche nous a permis de traduire en termes quantitatifs l’influence de certains facteurs internes et externes sur la production d’erreurs par l’apprenant avancé. Mots clés : analyse contrastive interlinguale, compétence phraséologique, verbe à haute fréquence, mésusage/suremploi/sousemploi. Introduction : méthode et corpus Il est actuellement admis que les séquences (semi) figées constituent des obstacles à l’appropriation d’une langue seconde ou étrangère (Mel’čuk 1993 ; Colson 2000 ; González Rey 2002 : 14), jusqu’à un niveau avancé d’apprentissage (Nesselhauf 2005 : 2) : « The knowledge of and the ability to use prefabricated units are [thus] essential for the language learner ; unfortunately, however, they also pose considerable difficulties, even for the advanced learner ». Mais peut-on pour autant parler d’une compétence « phraséologique » au même titre que les domaines de fragilité liés aux compétences syntaxique, lexicale, morphologique, rhétorique ou discursive (Bartning 1997 ; Bartning & Kirchmeyer 2003 ; Bartning & Schlyter 2004) ? Et si tel est le cas, quelles seraient les erreurs spécifiques à ce domaine de compétence langagière ? Afin de répondre à ces questions, nous avons adopté une méthode d’analyse de corpus mixte, où « intuition and data collection work hand in hand » (Partington 1998 : 1). Premièrement, nous avons effectué une analyse sur corpus d’apprenants (Granger 1998, 2004), permettant d’étudier l’usage de formes natives et non natives d’une interlangue du français langue étrangère (FL2) en termes de fréquence (sous-emploi/suremploi), notamment par rapport à l’usage de ces mêmes formes par des locuteurs natifs du français (FL1). La démarche adoptée pour tester notre hypothèse de travail est donc contrastive et interlangagière. Notre corpus d’étude (190 000 mots) est tiré du corpus informatisé d’apprenants FRIDA – FRench Interlanguage DAtabase (Cassart et alii 2002). Il relève de la variété dite « avancée » (VA) du FL2, les apprenants ayant un niveau d’instruction élevé (Bartning 1997) et le corpus répondant aux facteurs externes qui caractérisent traditionnellement la variété avancée en recherche acquisitionnelle : l’acquisition guidée (input par l’enseignement), l’apprentissage de la langue cible comme langue étrangère (LS=anglais), les connaissances métalinguistiques et la scolarisation (cadre institutionnel universitaire)1. Les textes se caractérisent par ailleurs par leur structure à visée argumentative, qu’il s’agisse de dissertations à proprement parler ou de textes narratifs, voire descriptifs. Dans une perspective quasi longitudinale, nous avons complété notre étude par l’analyse d’un corpus de FL2 de niveau intermédiaire (VI) pré-universitaire (50 000 mots). Le corpus de contrôle en FL1 (180 000 mots) se constitue quant à lui exclusivement de textes écrits argumentés produits par des apprenants du français à l’université. Nous avons extrait de nos corpus de manière semi-automatique (Oxford WordSmith Tools 4.0) 886 séquences verbonominales (SVN) dont la structure syntaxique est la suivante : SVN = N0[SUJ] + V prendre/donner + N1[OBJ] (+ N2[PREP]) D’un point de vue phraséologique, nous avons concentré notre étude sur les 589 séquences verbonominales semi figées ou figées (S(S)F)2 construites avec les verbes à haute fréquence prendre et donner, tirées du corpus d’apprenants avancés du FL2 (295 occ./190 000 mots) et du corpus de contrôle FL1 (294 occ./180 000 mots). Tableau 1. Répartition des séquences (semi) figées avec prendre et donner et nombre de séquences (semi) figées erronées dans les corpus. 1 2 Nous opérons une distinction entre le niveau dit « avancé » de la variété d’interlangue étudiée, qui repose sur des critères externes/extralinguistiques, et le niveau dit « avancé » des textes d’apprenants pris isolément, qui repose sur des critères internes/linguistiques. Le corpus FRIDA, bien qu’hétérogène puisque regroupant des textes de niveau intermédiaire à avancé, est donc considéré à ce titre comme représentatif de la variété avancée du FL2. Pour décider de l’appartenance d’une SVN à la catégorie des séquences libres ou à celle des séquences (semi) figées, nous nous sommes appuyée principalement sur les tables des expressions verbales figées élaborées par M. Gross dans le cadre du Lexique-Grammaire. prendre donner Total FL2 (LS=AN) VI VA 50 000 190 000 mots mots 77 textes 254 textes 43 occ. 148 occ. [25 ERR.] [48 ERR.] 43 occ. 147 occ. [23 ERR.] [59 ERR.] 86 occ. 295 occ. [48 ERR.] [107 ERR.] FL1 Corpus de contrôle 180 000 mots 330 textes 194 occ. [9 ERR.] 100 occ. [6 ERR.] 294 occ. [15 ERR.] Deuxièmement, une analyse paramétrique et statistique de nos données de corpus (Degand & Bestgen 2004) a permis de vérifier/infirmer nos hypothèses de travail par un traitement quantitatif et statistique de ces données. La systématisation de l’analyse qualitative passe ainsi par une phase cruciale d’opérationnalisation des données initiales (Baarda et alii 2004). L’outil principal de travail pour cette approche paramétrique et statistique est le logiciel de traitement statistique SPSS 12.0 (Statistical Package for Social Sciences)3. SPSS offre toutes les techniques de statistiques descriptives nécessaires à la valorisation des données : classification et description de populations, regroupement d'individus similaires, tests et détection de tendances, croisement de critères descriptifs, etc. Site officiel SPSS (http ://www.spss.com/fr) Par cette double approche sur corpus d’apprenants – contrastive/interlangagière et paramétrique/statistique –, nous avons pu observer l’influence de variables externes, telles que le niveau d’instruction (VI vs VA) ou la langue source de l’apprenant (FR vs AN), et l’influence de variables internes, telles que la nature du verbe à haute fréquence employé (prendre vs donner) ou le caractère acceptable de la S(S)F (acceptable vs erroné), sur la production d’unités phraséologiques verbo-nominales 3 Nous avons également eu recours, mais de manière plus sporadique, à un outil de statistique en ligne pour le calcul du Chi carré (http ://www.aly-abbara.com). par l’apprenant anglophone dans des textes écrits argumentés. Phraséologie et séquences (semi) figées La phraséologie est une discipline linguistique qui s’intéresse au processus de figement langagier. Elle a pour objet d’étude les « séquences semi figées » ou « figées » (S(S)F), appelées aussi « unités phraséologiques » (UP) : les S(S)F sont des séquences polylexicales constituées de deux ou plusieurs mots graphiques catégoriellement liés, contigus ou non, qui coapparaissent de manière préférentielle en usage. Une unité polylexicale se définit traditionnellement comme une catégorie grammaticale composée de plusieurs mots (lexèmes) séparés par un blanc (González Rey 2002). Les unités polylexicales se distinguent des constructions syntaxiques libres, dont les constituants conservent leur autonomie syntaxique et sémantique respective, ainsi que des formes dérivées et fléchies, constituées d’au moins un morphème non autonome (affixe ou désinence). Une séquence de plusieurs mots graphiques est dite « libre » (SL) quand elle ne fait l’objet d’aucune restriction idiosyncrasique : elle se définit syntaxiquement par sa flexibilité distributionnelle, sémantiquement par son caractère compositionnel, lexicalement par une ouverture des paradigmes, pragmatiquement par sa liberté d’emploi en situation de communication. Les (seules) contraintes qui régissent une SL sont les règles de syntaxe et les règles de restriction de sélection. (1) 4 [SL] Si une fabrique s'encrasse l'environement, on donne un policien une somme d'argent et la fabrique reçoit une permission et elle peut continuer à s'encrasser l'environement.4 (Corpus FL2, occ. 326) Dans les exemples, les caractères gras et les soulignements sont de nous. Le caractère gras est utilisé pour mettre en évidence le verbe à haute fréquence et le soulignement Par contraste, les S(S)F sont marquées par un haut degré de collocabilité, le principe de collocabilité se définissant comme la « tendance syntactico-sémantique des mots à entrer en combinaison avec d’autres termes, en nombre limité parmi une grande quantité de combinaisons possibles » (González Rey 2002 : 65-66). A l’instar de Lamiroy (2003) et Svensson (2004), nous retenons trois critères linguistiques définitoires des S(S)F, en tant qu’elles se caractérisent de manière non exclusive par - un certain degré de fixité syntaxique (blocage des propriétés transformationnelles et ordre des constituants inaltérable) ; et/ou - un certain degré d’opacité sémantique (noncompositionnalité au moins partielle) ; et/ou - un certain degré de restriction lexicale (blocage paradigmatique). Nous comprenons par fixité syntaxique un certain degré de contrainte sur l’ordre des constituants et de blocage des propriétés transformationnelles d’une séquence donnée. « Une séquence est figée du point de vue syntaxique quand elle refuse toutes les possibilités combinatoires ou transformationnelles qui caractérisent habituellement une suite de ce type » (G. Gross 1996 : 154). La fixité se définit par opposition à la syntaxe libre des SL qui sont dites « flexibles ». L’opacité est quant à elle un des traits du figement le plus généralement reconnu par les chercheurs en phraséologie. Une séquence « est figée sémantiquement quand le sens est opaque ou non compositionnel, c’est-à-dire quand il ne peut pas être déduit du sens des éléments composants » (G. Gross 1996 : 154). Les mécanismes de figuration tropique par métaphore/métonymie jouent souvent un rôle important dans ce processus d’opacification. Enfin, les S(S)F se caractérisent par une contrainte opérant sur les possibilités de substitution synonymique des paradigmes ou, en d’autres termes, par un certain degré pour mettre en relief compléments du verbe. les syntagmes nominaux de restriction lexicale ou de « blocage des paradigmes synonymiques » (G. Gross 1996 : 17-18). Nous adoptons donc une définition pluridimensionnelle et scalaire du figement, allant des constructions les plus libres aux plus figées. Une étude pilote5 menée sur le degré de figement de 200 SVN construites avec le verbe prendre en FL1 (Bolly à paraître), a ainsi mis en évidence la forte corrélation (ρ = 0,411 à 0,487, p = 0,000) existant entre les trois critères linguistiques de figement, à savoir la fixité syntaxique, l’opacité sémantique et la restriction lexicale. Les résultats montrent que plus il y a de contraintes combinées au sein d’une même SVN, plus le degré de figement global de cette séquence est élevé. Les exemples de S(S)F repris ci-dessous comportent une indication quant au degré de figement global de la S(S)F en cotexte, allant du plus libre au plus figé (SSF- → SSF+ → SF).6 (2) [SSF-] Rêve qui prit des allures sérieuses, lorsqu' en 1951, la Belgique, l' ancienne République fédérale d' Allemagne, la France, l' Italie et les Pays-bas, signèrent le traité instaurant la communauté européenne du charbon et de l' acier. (Corpus FL1, occ. 591) (3) [SSF+] je veux dire qu'il a prit connaissance de ses emotions et peut donc les controler (Corpus FL1, occ. 133) (4) [SF] nous ne sommes pas tous président, ministre où professeur français qui prennent la grande part du gâteau. (FL2, occ. 69) Par ailleurs, certaines S(S)F appartiennent à une catégorie spécifique à l’interlangue d’apprenants : elles se caractérisent par leur forme déviante et ne 5 6 Le corpus utilisé pour cette étude se constitue d’ 1 million de mots en français langue première (français de Belgique et français de France) et comprend des textes de presse écrite, des textes littéraires narratifs et dramaturgiques, des textes oraux et des textes argumentatifs. Pour une analyse détaillée du degré de figement des SVN avec prendre en termes de critères syntaxiques, sémantiques et lexicaux, nous renvoyons à l’article précité (Bolly à paraître). correspondent à aucune S(S)F normée repérable dans l’usage en FL1. Nous les avons regroupées sous la catégorie des SPILI (Séquences Préfabriquées Interlangagières Intérimaires, Forsberg à paraître). (5) [SPILI] Pour entamer le sujet d'immigration en France, il faut d'abord donner une brève histoire de l'immigration en France (FL2, occ. 492) Analyse contrastive : les séquences (semi) figées dans un corpus d’apprenants anglophones du français langue seconde Dans leur article sur le verbe à haute fréquence make, Altenberg & Granger (2001) mettent en exergue la coexistence de résultats de recherche a priori contradictoires concernant l’usage des verbes à haute fréquence (VHF) par des apprenants de l’anglais langue étrangère. Alors que les premiers résultats tendent à démontrer un suremploi des VHF par l’apprenant (Hasselgren 1994 ; Källvist 1999), les seconds mettent en évidence une tendance au sous-emploi de ces VHF (Sinclair 1991). Le suremploi de ces verbes serait lié à divers facteurs (Altenberg & Granger 2001 : 174) : leur apprentissage précoce dans le curriculum acquisitionnel, la richesse de leurs possibilités d’emploi, ainsi que l’influence du transfert positif entre des langues proches. Le sous-emploi serait dû quant à lui principalement à des stratégies d’évitement, les VHF étant souvent constitutifs de constructions « délexicales », c’est-à-dire de constructions verbo-nominales à verbe support. En d’autres termes, le sous-emploi des VHF par l’apprenant serait dû à une stratégie d’évitement mise en place pour contourner la difficulté des emplois phraséologiques de ces verbes. Sous-emploi des séquences (semi) figées et suremploi des séquences libres par l’apprenant du FL2 Suite au double constat fait par Altenberg & Granger (2001), nous émettons une première hypothèse concernant les deux VHF prendre et donner en FL2, en termes de suremploi/sous-emploi, dans une perspective spécifiquement phraséologique. Cette hypothèse tient compte, d’une part, des stratégies d’évitement mises en place par l’apprenant du FL2 pour les emplois phraséologiques des VHF (cf. ci-dessus) et, d’autre part, de l’apprentissage tardif des unités phraséologiques dans le curriculum acquisitionnel. Hypothèse 1 La fréquence des S(S)F produites par les locuteurs natifs (LN) du français serait plus élevée que celle des S(S)F produites par les locuteurs non natifs (LNN) du français. Autrement dit, il y aurait un sous-emploi des S(S)F avec les verbes prendre et donner par les apprenants anglophones avancés du FL2, en situation de production écrite argumentée. Suite à l’examen de nos données quantitatives (Cf. Tableau 2, ci-dessous), nous observons que la proportion d’emplois des S(S)F est aussi importante chez les LN que chez les LNN (> 70%), ce qui traduit une tendance des natifs comme des non natifs à l’emploi fréquent de S(S)F, par opposition à l’emploi de SL. Notons toutefois que le LN produit légèrement plus d’unités phraséologiques (82,6%) que le LNN (70,9%). Tableau 2. Influence de la langue source de l’apprenant sur la production de SVN libres vs (semi) figées (test statistique du Chi carré). FL2/VA FL1 Total SL 121 29,1% 62 17,4% 183 S(S)F 295 70,9% 294 82,6% 589 Total 416 100,0% 356 100,0% 772 Χ2 Χ2 = 14,448 ddl = 1 p = 0,000* D’un point de vue statistique, nous avons pu observer que le nombre d’unités phraséologiques produites (vs le nombre de séquences libres) variait de manière significative7 (Χ2 = 14,448, ddl = 1, p = 0,000) en fonction de la langue source de l’apprenant. Dans un premier temps, ces résultats appuient la première constatation faite par Altenberg & Granger (2001) sur l’emploi des VHF par l’apprenant d’une L2 : il y a suremploi des SVN avec prendre et donner chez les apprenants anglophones (416 occ.) par rapport aux francophones natifs (356 occ.). Dans un second temps, alors que le nombre d’occurrences (semi) figées est équivalent chez le LNN et le LN (295 et 294 occ.), le LNN produit deux fois plus de SVN libres (121 occ.) que le LN (62 occ.). Nous constatons donc que le phénomène de suremploi des VHF par les apprenants anglophones avancés est en fait lié à un suremploi des SL, et non à un sous-emploi des unités phraséologiques par ces mêmes apprenants du FL2. Sous-emploi des séquences (semi) figées avec prendre vs suremploi des séquences (semi) figées avec donner par l’apprenant du FL2 A partir de ces résultats globaux, nous formulons une seconde hypothèse tenant compte des éventuelles caractéristiques propres à chacun des VHF prendre et donner. Hypothèse 2 De par leurs spécificités linguistiques, il y aurait une différence de fréquence en FL2 entre les S(S)F avec prendre et celles avec donner. Cette différence serait traductible en termes de suremploi/sous-emploi. Tableau 3. Influence de la langue source de l’apprenant sur la production de S(S)F avec prendre vs donner (test statistique du Chi carré). 7 Les résultats statistiques par croisement en Chi carré ont été considérés comme étant significatifs quand le coefficient de contingence (p) était inférieur ou égal à 0,05. Les résultats statistiquement significatifs sont marqués par un astérisque (*) dans les tableaux. SSF Prendre Donner Total Χ2 FL2/VA 148 50,2% 147 49,8% 295 100% FL1 194 66% 100 34% 294 100% Χ2 = 15,129 ddl = 1 p = 0,000* Total 342 247 589 Selon les résultats statistiques obtenus, la différence d’emploi des S(S)F construites avec prendre et donner, en FL2 vs FL1, est hautement significative (Χ2 = 15,129, ddl = 1, p = 0,000). En effet, alors qu’en FL1 la proportion de S(S)F construites avec prendre représente 2/3 des S(S)F pour 1/3 seulement avec donner, l’apprenant anglophone avancé du FL2 produit autant de S(S)F avec prendre (50,2%) qu’avec donner (49,8%). Ces résultats très significatifs traduisent donc une tendance des apprenants anglophones avancés du FL2 au suremploi des S(S)F avec le verbe donner et un sous-emploi des S(S)F avec le verbe prendre. Comment expliquer cette différence ? Nous proposons ici plusieurs explications liées à la spécificité du système linguistique de chacun de ces VHF : une différence de système flexionnel, leur caractère plus ou moins polysémique, leur comportement plus ou moins phraséologique. Du point de vue flexionnel, par exemple, nous pouvons supposer que la régularité de la conjugaison du verbe donner (en –ER) engendrerait un emploi plus aisé, voire un suremploi, de ce VHF par l’apprenant du FL2. Par opposition, l’irrégularité de la conjugaison du verbe prendre favoriserait la stratégie d’évitement et le sous-emploi des S(S)F qui le contiennent. Ces explications demandent toutefois à être vérifiées dans une phase ultérieure de recherche. Mésusage des S(S)F par l’apprenant en FL2 et FL1 : acquisition d’une compétence phraséologique Le caractère acceptable ou erroné des S(S)F a été déterminé par le biais d’un test d’élicitation inter-juges (8 locuteurs francophones natifs, dont 4 spécialistes de la langue française). Les résultats de ce test rendent compte du degré d’acceptabilité de chacune des séquences étudiées en cotexte, sur une échelle allant du moins acceptable ou plus acceptable (de 1 à 5). Quand l’énoncé était jugé inacceptable (valeurs 1 à 2), il était demandé au juge de localiser l’origine présumée de l’erreur. L’étude sur l’appartenance des S(S)F à une norme langagière et sur le caractère attesté de ces formes en usage s’est basée sur l’examen des Tables de M. Gross précitées et, uniquement en cas de doute, nous avons eu recours au moteur de recherche Google.fr et au concordanceur en ligne Glossanet (Fairon 1999). Notre analyse contrastive des erreurs produites par les apprenants du FL2 est formulée sous l’hypothèse suivante : Hypothèse 3 Le niveau d’interlangue des apprenants aurait une influence sur la fréquence des erreurs portant sur les S(S)F. Plus précisément, la fréquence décroissante d’erreurs portant sur les S(S)F irait de pair avec le niveau d’acquisition grandissant des apprenants. Pour tester l’influence du niveau d’acquisition de l’apprenant (variable ordinale) sur l’acceptabilité de la S(S)F (variable nominale), nous avons procédé au test de Mann-Whitney (Cf. Tableau 4, ci-dessous). La différence statistique est très significative (U = 20518,5, p = 0,000) : plus la variété d’interlangue est avancée, plus les S(S)F sont acceptables (Rang moyen 382,37), et inversement pour les S(S)F erronées (Rang moyen 206,20). La même comparaison envisagée sous l’angle d’un croisement entre variables nominales, en l’occurrence la catégorie d’interlangue et la (non) acceptabilité des S(S)F), montre un résultat également très significatif (Χ2 = 49,482, ddl = 2, p < 0,001). Tableau 4. Fréquences relatives des S(S)F acceptables/erronées dans les interlangues : variété intermédiaire du FL2 (VI), variété avancée du FL2 (VA) et corpus natif du FL1. n /50 000 mots S(S)F acceptables S(S)F erronées Total FL2/VI FL2/VA FL1 Total Statistiques 38 49,4 77,5 164,9 48 28,2 4,2 80,4 86 77,6 81,7 245,3 Test de MannWhitney U = 20518,5, p = 0,000* Test du Chi carré Χ2 = 49,482, ddl = 2, p < 0,001* Ces résultats confirment que l’acceptabilité des S(S)F construites avec les VHF prendre et donner dépend fortement du niveau d’acquisition de l’apprenant. Autrement dit, il y a bien une progression vers une acquisition de la compétence « phraséologique » et, plus spécialement, vers une compétence de production des S(S)F avec prendre et donner à l’écrit argumenté par les apprenants anglophones avancés du FL2. Mésusage des S(S)F par l’apprenant du FL2 : fréquence et types d’erreurs spécifiques aux verbes prendre vs donner S’il y a bien une compétence « phraséologique », quelles seraient les erreurs les plus fréquentes ou spécifiques à la variété avancée du FL2 ? Les types d’erreurs sont-ils spécifiques aux verbes prendre vs donner ? Hypothèse 4 La fréquence et le type d’erreurs produites en FL2 varieraient en fonction du VHF (prendre vs donner) de la S(S)F. Pour tester cette hypothèse, nous avons d’une part examiné la proportion d’erreurs commises dans les S(S)F par l’apprenant avancé en FL2 (vs FL1) et, d’autre part, la proportion d’erreurs en FL2 portant sur les S(S)F avec prendre par opposition aux S(S)F avec donner. Or, alors que la proportion des S(S)F erronées chez le LN est sensiblement la même pour les deux verbes (± 5%), la proportion d’erreurs chez le LNN est un peu plus élevée avec donner (40,1%) qu’avec prendre (32,4%). Mais cette légère différence au sein de la variété avancée du FL2 estelle pour autant statistiquement significative ? Comme l’indiquent les résultats statistiques (Cf. Tableau 5), la nature du VHF utilisé par le LNN dans les S(S)F n’influence pas de manière significative (p > 0,10) le caractère acceptable ou erroné de cette S(S)F. Tableau 5. Influence du type de verbe à haute fréquence sur l’acceptabilité des S(S)F produites par les apprenants du FL2-VA (test statistique du Chi carré). FL2/VA Prendre Donner Total S(S)F erronée 48 59 107 S(S)F acceptable 100 88 188 Total S(S)F 148 147 295 Χ2 Χ2 = 1,893 ddl = 1 p > 0,10 Quant à la spécificité des erreurs produites par l’apprenant anglophone avancé du FL2, nous retiendrons premièrement que ce sont les erreurs portant sur le verbe (Ex. 6) ou sur la SVN prise dans sa totalité (Ex. 7) qui sont les plus fréquentes : 1/3 des constituants verbaux et 1/3 des SVN sont employés erronément dans les unités phraséologiques. (6) Je *[donnai] un coup d'oeil à ma amie (FL2, occ. 344) → [jetai] (7) Je vous promets que l'assainaissement *[prendre place comme] un issu d'urgence. (FL2, occ. 117) → [tiendra lieu de] Viennent ensuite les erreurs portant sur le déterminant de l’élément nominal postverbal avec 1/5 des emplois erronés dans les unités phraséologiques. (8) Dans le cas de « l'ours » l'auteur veut donner *[de l']information afin de provoquer une reaction. (FL2, occ. 355) → [des] Par ailleurs, les résultats statistiques (Χ2 = 5,793, ddl = 1, p < 0,02) montrent une forte influence du type de VHF utilisé par l’apprenant du FL2 (prendre vs donner) sur l’emploi erroné du constituant verbal des S(S)F : 61% des erreurs portant sur le verbe sont commises avec le verbe prendre pour 39% des erreurs sur le verbe avec donner. On observe également une différence très significative concernant les erreurs portant sur le syntagme nominal postverbal prépositionnel (Χ2 = 8,974, ddl = 1, p < 0,01) : la totalité des erreurs de ce type concerne les S(S)F avec le verbe donner 8. (9) Premièrement les Français ne pouvaient pas planifier leur vie pendant la guerre donc ils ont décidé de donner naissance *[∅] sans penser aux conséquences. (FL2, occ. 507) → [à NHumain] Conclusion : la notion de compétence « phraséologique » chez l’apprenant anglophone avancé du FL2 Nous avons étudié dans cet article la notion de compétence « phraséologique » en formulant des hypothèses qui ont été testées quantitativement et statistiquement par le biais d’une analyse sur corpus d’apprenants. Certains facteurs externes et internes, comme la L1 de l’apprenant, le niveau d’acquisition de celui-ci ou le type de verbe à haute fréquence (VHF) employé, ont été explorés dans cette étude. Ces facteurs affectent en effet la production d’unités phraséologiques (vs libres) par l’apprenant, mais aussi la production d’erreurs spécifiques à ce type d’unités. Les conclusions qui peuvent être tirées de cette étude contrastive se limitent cependant au champ d’étude du FL2 et concernent uniquement les apprenants anglophones, en situation de production écrite de textes argumentés, dans un cadre institutionnel universitaire. En résumé, les résultats obtenus ont montré que les apprenants anglophones avancés du FL2 suremployaient les séquences verbo-nominales (SVN) libres construites avec les VHF prendre ou donner (Cf. Hypothèse 1). Le 8 Ce résultat est cependant à relativiser puisque l’effectif des erreurs portant sur le SN prépositionnel des S(S)F avec le verbe prendre est nul. sous-emploi d’unités phraséologiques n’a pas été démontré à ce stade. Mais en étudiant de plus près la fréquence des séquences (semi) figées (S(S)F) avec prendre par opposition à celles avec donner, nous avons mis en évidence un sous-emploi des S(S)F avec prendre et un suremploi des S(S)F avec donner (Cf. Hypothèse 2). Les deux verbes, bien qu’étant tous les deux des verbes à haute fréquence à haut potentiel phraséologique, se différencient donc pourtant l’un de l’autre dans les productions des apprenants anglophones. Il serait par conséquent très intéressant, suite à cette analyse à visée descriptive, d’étudier ce phénomène d’un point de vue explicatif : la richesse plus ou moins polysémique des deux verbes ou leur système flexionnel plus ou moins complexe auraient-ils une influence sur d’éventuelles stratégies d’évitement (sous-emploi) ou de surgénéralisation (suremploi) des emplois phraséologiques par l’apprenant ? Ensuite, nous avons montré qu’il y avait bien une évolution de l’apprenant anglophone avancé du FL2 vers l’acquisition d’une compétence « phraséologique » (Cf. Hypothèse 3). Suite à ce constat, nous avons examiné les erreurs faites par les apprenants dans les unités phraséologiques qu’ils produisaient (Cf. Hypothèse 4). Nous avons ainsi mis en exergue le fait que le type de VHF dans une S(S)F n’influençait pas de manière significative le caractère acceptable ou erroné de cette S(S)F. Une étude de fréquence sur les types d’erreurs dans les S(S)F nous a révélé que les erreurs portant sur l’élément verbal ou sur toute la séquence verbo-nominale étaient proportionnellement les plus importantes. Viennent ensuite les erreurs portant sur le déterminant. Considérant les emplois phraséologiques où c’est l’emploi verbal qui est erroné, nous avons vu que la différence entre les erreurs produites avec le verbe prendre et celles produites avec le verbe donner était très significative : l’apprenant avancé anglophone du FL2 éprouverait plus de difficulté à produire correctement des S(S)F avec le verbe prendre qu’avec le verbe donner, en ce qui concerne le choix du constituant verbal correct. Pour affiner ces résultats, nous envisageons dans un premier temps d’explorer les hypothèses explicatives précitées, à savoir le caractère plus ou moins polysémique des deux verbes et leur système flexionnel. Dans un second temps, nous nous proposons de prolonger nos recherches en étudiant l’influence du degré de variabilité/flexibilité des S(S)F en usage (FL1) sur la production d’erreurs en FL2. Enfin, une étude sur corpus de textes d’apprenants néerlandophones avancés du FL2 permettrait de mieux cerner les spécificités de la variété d’interlangue dite « avancée » du FL2, mais aussi de déterminer les spécificités liées à chacun des groupes d’apprenants en fonction de sa L1. Bibliographie ALTENBERG, B., GRANGER, S. (2001) : « The Grammatical and Lexical Patterning of MAKE in Native and Non-native Student Writing », Applied Linguistics, 22/2 ; 173-194. BAARDA, D.B., de GOEDE, M.P.M., van DIJKUM, C.J. (2004) : Introduction to Statistics with SPSS – A guide to the processing, analysing and reporting of (research) data. Groningen/Houten (The Netherlands) : Wolters-Noordhoff. BARTNING, I. (1997) : « L’apprenant dit avancé et son acquisition d’une langue étrangère – Tour d’horizon et esquisse d’une caractérisation de la variété avancée », AILE, 9 ; 9-50. BARTNING, I., KIRCHMEYER, N. (2003) : « Le développement de la compétence textuelle à travers les stades acquisitionnels en français L2 », AILE, 19 ; 9-39. BARTNING, I., SCHLYTER, S. (2004) : « Itinéraires acquisitionnels et stades de développement en français L2 », French Language Studies, 14 ; 281-299. BOLLY, C. (à paraître) : « Au seuil du figement. Séquences (semi) figées avec le verbe à haute fréquence prendre en FL1 et FL2 », in BOLLY, C., LAMIROY, B., KLEIN, J.R. (éds) : La Phraséologie dans tous ses états. Théorie et application. Louvain-la-Neuve (Belgique), 13-15 octobre 2005. Louvainla-Neuve : Cahiers de l’Institut de Linguistique de Louvain. CASSART, A. et alii (éds) (2002) : Free Text – Deliverable 15, Three Error-Coded Corpora. Louvain-la-Neuve : UCL/Centre for English Corpus Linguistics. COLSON, J.-P. (2000) : « Les locutions verbales françaises et allemandes dans le discours journalistique : pistes de recherche, fausses pistes, pistes brouillées (I. Pistes pour le français) », in GRECIANO, G. (éd.) : Micro- et macrolexèmes et leur figement discursif. Louvain-Paris : Peeters ; 173-199. DEGAND, L., BESTGEN, Y. (2004) : « Connecteurs et analyses de corpus : de l’analyse manuelle à l’analyse automatisée », in PORHIEL, S., KLINGLER, D. (éds) : L’Unité texte (Actes du colloque ‘Regards croisés sur l’Unité texte/Conjoint Perspectives on Text). Chypre, 18- 20 mars 2004 ; 49-73. FAIRON, C. (1999) : « Parsing a Web Site as a Corpus », in FAIRON, C. (éd.) : Analyse lexicale et syntaxique : le système INTEX, Lingvisticae Investigationes, XXII (Volume spécial). Amsterdam/Philadelphia : John Benjamins. FORSBERG, F. (à paraître) : « “Prêt-à-parler”. Les séquences préfabriquées en français parlé L2 et L1 », in BOLLY, C., LAMIROY, B., KLEIN, J.R. (éds) : La Phraséologie dans tous ses états. Théorie et application. Louvain-la-Neuve (Belgique), 13-15 octobre 2005. Louvain-la-Neuve : Cahiers de l’Institut de Linguistique de Louvain. GONZÁLEZ REY, I. (2002) : La phraséologie du français. Toulouse : Presses universitaires du Mirail. GRANGER, S. (1998) : « The computer learner corpus : a versatile new source of data for SLA research », in GRANGER, S. (éd.) : Learner English on Computer. London/New York : Longman ; 3-18. GRANGER, S. (2004) : « Computer Learner Corpus Research : Current Status and Future Prospects », in CONNOR, U., UPTON, T. (éds) : Applied Corpus Linguistics : A Multidimensional Perspective. Amsterdam/Atlanta : Rodopi ; 123-145. GROSS, G. (1996) : Les expressions figées en français – Noms composés et autres locutions. Paris : Ophrys. LAMIROY, B. (2003) : « Les notions linguistiques de figement et de contrainte », Actes du colloque rendant hommage à Maurice Gross. Paris (France), 3 juin 2002. Linguisticae Ivestigationes, 26/1 ; 1-14. MEL’CUK, I. (1993) : « La phraséologie et son rôle dans l’enseignement/apprentissage d’une langue étrangère », Revue de Linguistique Appliquée, 92 ; 82-113. NESSELHAUF, N. (2004) : « How learner corpus analysis can contribute to language teaching : A study of support verb constructions », in ASTON, G., BERNARDINI, S., STEWART, D. (éds) : Corpora and Language Learners. Philadelphia/Amsterdam : John Benjamins/Studies in Corpus Linguistics ; 109-124. NESSELHAUF, N. (2005) : Collocations in a Learner Corpus. Amsterdam/Philadelphia : John Benjamins. PARTINGTON, A. (1998) : Patterns and Meanings – Using Corpora for English Language Research and Teaching. Philadelphia/Amsterdam : John Benjamins/Studies in Corpus Linguistics. SVENSSON, M. H. (2004) : Critères de figement – L'identification des expressions figées en français contemporain. Umeå university (Suède) : Institutionen för Moderna Språk Publikationer. Sites Internet et ressources informatiques : Glossanet, concordanceur en ligne : [http://glossa.fltr.ucl.ac.be] Outil de statistique en ligne pour le calcul du Khi-carré : [http://www.aly-abbara.com] Oxford WordSmith Tools 4.0. Site officiel de Mike Scott : [http://www.lexically.net] SPSS – Statistical Package for Social Sciences. Site officiel SPSS : [http://www.spss.com/fr] Contact et remerciement Courrier électronique de l’auteur : [email protected] Ce travail s’inscrit dans le cadre d’une recherche financée par le projet d’ « Action de recherche concertée » du Gouvernement de la Communauté française de Belgique. Le champ d’étude de ce projet collectif, intitulé Foreign Language Learning : Phraseology and Discourse (ARC 03/08-301), est l’appropriation des langues étrangères (français, néerlandais et anglais) d’un point de vue phraséologique et discursif, essentiellement en situation de production écrite.