Preprint

Téléchargement

La notion de compétence « phraséologique ».

Verbes à haute fréquence et corpus

d’apprenants anglophones avancés

Catherine BOLLY

Université catholique de Louvain, CELEXROM

(Belgique)

Abstract : It is now generally accepted that phraseological units are an

area of great difficulty in second language acquisition, even for

advanced learners (Nesselhauf 2004, 2005). Can one nevertheless

assume that learners acquire such a thing as « phraseological »

competence ? To answer this question, we analyzed 589 verb-noun

(semi) fixed combinations with two high frequency verbs, namely

prendre and donner, taken from a corpus of argumentative texts (190 000

words) produced by advanced English learners of French as a second

language and by French native speakers (180 000 words). In addition to

carrying out a contrastive interlanguage analysis of our learner data

(Granger 1998, 2004), we also used a parametric and statistical method

of data treatment as described in Degand & Bestgen (2004). This

combined method of analysis has allowed us to quantify several

internal and external parameters which are likely to influence the

acquisition of phraseological units.

Key words : contrastive interlanguage analysis, phraseological

competence, high frequency verb, misuse/overuse/underuse.

Résumé : Il est actuellement admis que les unités phraséologiques

constituent des obstacles à l’appropriation d’une langue seconde,

jusqu’à un niveau avancé d’apprentissage (Nesselhauf 2004, 2005). Mais

peut-on pour autant parler d’une compétence « phraséologique » ? Pour

tenter de répondre à cette question, nous avons analysé 589 séquences

(semi) figées construites avec les verbes à haute fréquence prendre et

donner, tirées d’un corpus d’apprenants anglophones avancés du

français langue seconde (190 000 mots) et d’un corpus de français

langue première (180 000 mots). Parallèlement à une analyse contrastive

sur corpus d’apprenants (Granger 1998, 2004), nous avons effectué une

analyse paramétrique et statistique des données de corpus (Degand &

Bestgen 2004). Cette double approche nous a permis de traduire en

termes quantitatifs l’influence de certains facteurs internes et externes

sur la production d’erreurs par l’apprenant avancé.

Mots clés : analyse contrastive interlinguale, compétence

phraséologique, verbe à haute fréquence, mésusage/suremploi/sous-

emploi.

Introduction : méthode et corpus

Il est actuellement admis que les séquences (semi)

figées constituent des obstacles à l’appropriation d’une

langue seconde ou étrangère (Mel’čuk 1993 ; Colson

2000 ; González Rey 2002 : 14), jusqu’à un niveau avancé

d’apprentissage (Nesselhauf 2005 : 2) : « The knowledge

of and the ability to use prefabricated units are [thus]

essential for the language learner ; unfortunately,

however, they also pose considerable difficulties, even

for the advanced learner ». Mais peut-on pour autant

parler d’une compétence « phraséologique » au même

titre que les domaines de fragilité liés aux compétences

syntaxique, lexicale, morphologique, rhétorique ou

discursive (Bartning 1997 ; Bartning & Kirchmeyer 2003 ;

Bartning & Schlyter 2004) ? Et si tel est le cas, quelles

seraient les erreurs spécifiques à ce domaine de

compétence langagière ? Afin de répondre à ces

questions, nous avons adopté une méthode d’analyse de

corpus mixte, où « intuition and data collection work

hand in hand » (Partington 1998 : 1).

Premièrement, nous avons effectué une analyse sur

corpus d’apprenants (Granger 1998, 2004), permettant

d’étudier l’usage de formes natives et non natives d’une

interlangue du français langue étrangère (FL2) en termes

de fréquence (sous-emploi/suremploi), notamment par

rapport à l’usage de ces mêmes formes par des locuteurs

natifs du français (FL1). La démarche adoptée pour tester

notre hypothèse de travail est donc contrastive et

interlangagière. Notre corpus d’étude (190 000 mots) est

tiré du corpus informatisé d’apprenants FRIDA – FRench

Interlanguage DAtabase (Cassart et alii 2002). Il relève de la

variété dite « avancée » (VA) du FL2, les apprenants

ayant un niveau d’instruction élevé (Bartning 1997) et le

corpus répondant aux facteurs externes qui caractérisent

traditionnellement la variété avancée en recherche

acquisitionnelle : l’acquisition guidée (input par

l’enseignement), l’apprentissage de la langue cible

comme langue étrangère (LS=anglais), les connaissances

métalinguistiques et la scolarisation (cadre institutionnel

universitaire)

. Les textes se caractérisent par ailleurs par

leur structure à visée argumentative, qu’il s’agisse de

dissertations à proprement parler ou de textes narratifs,

voire descriptifs. Dans une perspective quasi

longitudinale, nous avons complété notre étude par

l’analyse d’un corpus de FL2 de niveau intermédiaire

(VI) pré-universitaire (50 000 mots). Le corpus de

contrôle en FL1 (180 000 mots) se constitue quant à lui

exclusivement de textes écrits argumentés produits par

des apprenants du français à l’université. Nous avons

extrait de nos corpus de manière semi-automatique

(Oxford WordSmith Tools 4.0) 886 séquences verbo-

nominales (SVN) dont la structure syntaxique est la

SVN = N0[SUJ] + V prendre/donner + N1[OBJ] (+ N2[PREP])

D’un point de vue phraséologique, nous avons

concentré notre étude sur les 589 séquences verbo-

nominales semi figées ou figées (S(S)F)

construites avec

les verbes à haute fréquence prendre et donner, tirées du

corpus d’apprenants avancés du FL2 (295 occ./190 000

mots) et du corpus de contrôle FL1 (294 occ./180 000

mots).

Tableau 1. Répartition des séquences (semi) figées avec prendre et

donner et nombre de séquences (semi) figées erronées dans les corpus.

Nous opérons une distinction entre le niveau dit « avancé »

de la variété d’interlangue étudiée, qui repose sur des

critères externes/extralinguistiques, et le niveau dit

« avancé » des textes d’apprenants pris isolément, qui

repose sur des critères internes/linguistiques. Le corpus

FRIDA, bien qu’hétérogène puisque regroupant des textes

de niveau intermédiaire à avancé, est donc considéré à ce

titre comme représentatif de la variété avancée du FL2.

Pour décider de l’appartenance d’une SVN à la catégorie

des séquences libres ou à celle des séquences (semi) figées,

nous nous sommes appuyée principalement sur les tables

des expressions verbales figées élaborées par M. Gross

dans le cadre du Lexique-Grammaire.

FL2 (LS=AN)

VI VA FL1

Corpus de contrôle

50 000

mots

77 textes

190 000

mots

254 textes

180 000 mots

330 textes

prendre 43 occ.

[25 ERR.] 148 occ.

[48 ERR.] 194 occ.

[9 ERR.]

donner 43 occ.

[23 ERR.] 147 occ.

[59 ERR.] 100 occ.

[6 ERR.]

Total 86 occ.

[48 ERR.] 295 occ.

[107 ERR.] 294 occ.

[15 ERR.]

Deuxièmement, une analyse paramétrique et

statistique de nos données de corpus (Degand & Bestgen

2004) a permis de vérifier/infirmer nos hypothèses de

travail par un traitement quantitatif et statistique de ces

données. La systématisation de l’analyse qualitative

passe ainsi par une phase cruciale d’opérationnalisation

des données initiales (Baarda et alii 2004). L’outil

principal de travail pour cette approche paramétrique et

statistique est le logiciel de traitement statistique SPSS

12.0 (Statistical Package for Social Sciences)

SPSS offre toutes les techniques de statistiques

descriptives nécessaires à la valorisation des données :

classification et description de populations,

regroupement d'individus similaires, tests et détection

de tendances, croisement de critères descriptifs, etc.

Site officiel SPSS (http ://www.spss.com/fr)

Par cette double approche sur corpus d’apprenants –

contrastive/interlangagière et paramétrique/statistique –,

nous avons pu observer l’influence de variables externes,

telles que le niveau d’instruction (VI vs VA) ou la langue

source de l’apprenant (FR vs AN), et l’influence de

variables internes, telles que la nature du verbe à haute

fréquence employé (prendre vs donner) ou le caractère

acceptable de la S(S)F (acceptable vs erroné), sur la

production d’unités phraséologiques verbo-nominales

Nous avons également eu recours, mais de manière plus

sporadique, à un outil de statistique en ligne pour le calcul

du Chi carré (http ://www.aly-abbara.com).

par l’apprenant anglophone dans des textes écrits

argumentés.

Phraséologie et séquences (semi) figées

La phraséologie est une discipline linguistique qui

s’intéresse au processus de figement langagier. Elle a

pour objet d’étude les « séquences semi figées » ou

« figées » (S(S)F), appelées aussi « unités

phraséologiques » (UP) : les S(S)F sont des séquences

polylexicales constituées de deux ou plusieurs mots

graphiques catégoriellement liés, contigus ou non, qui co-

apparaissent de manière préférentielle en usage. Une

unité polylexicale se définit traditionnellement comme

une catégorie grammaticale composée de plusieurs mots

(lexèmes) séparés par un blanc (González Rey 2002). Les

unités polylexicales se distinguent des constructions

syntaxiques libres, dont les constituants conservent leur

autonomie syntaxique et sémantique respective, ainsi que

des formes dérivées et fléchies, constituées d’au moins un

morphème non autonome (affixe ou désinence).

Une séquence de plusieurs mots graphiques est dite

« libre » (SL) quand elle ne fait l’objet d’aucune

restriction idiosyncrasique : elle se définit

syntaxiquement par sa flexibilité distributionnelle,

sémantiquement par son caractère compositionnel,

lexicalement par une ouverture des paradigmes,

pragmatiquement par sa liberté d’emploi en situation de

communication. Les (seules) contraintes qui régissent une

SL sont les règles de syntaxe et les règles de restriction de

sélection.

(1) [SL] Si une fabrique s'encrasse l'environement, on donne un

policien une somme d'argent et la fabrique reçoit une

permission et elle peut continuer à s'encrasser

l'environement.

(Corpus FL2, occ. 326)

Dans les exemples, les caractères gras et les soulignements

sont de nous. Le caractère gras est utilisé pour mettre en

évidence le verbe à haute fréquence et le soulignement

1 / 19 100%

Documents connexes

RESUMé français - Université d`Oran 2

ANNEXE C : Habiletés et attitudes transversales

intro annexe-c

intro ann-c

Plusieurs systèmes de formation actuellement offerts

File - Travail Pratique 3

enseignement individualisé

Présentation PowerPoint - Ecole des Sciences du Cancer

corpus 10 mai nrc13

BA 7 – EVALUATION ORALE DRAMATURGIE Liste de textes 3

le corps dans tous ses etats dans l`oeuvre de john donne

Le jeu de rôle dans la pédagogie médicale

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Preprint

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Preprint

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib