Berard-AFLS2012

publicité
Entre codification et liberté : Variation
des constructions de contrôles à distance
en français contemporain
AFLS, Newcastle, 03/06/12
[email protected]
www.atilf.fr
Analyse et Traitement Informatique de la Langue Française
Langue et variation
Sujet : les constructions de contrôles à distance
(CAD) en français contemporain
Questions :
figement ou variation ?
Variation stylistique : en fonction de quels critères ?
2
Analyse et Traitement Informatique de la Langue Française
Définition des contrôles à distance
3
« Long distance dependencies », « Wh-movement »
(Ross 67, Chomsky 77)
Qu’est-ce que
tu veux que
complément_antéposé
« Verbe_pont »
(Erteschik 73)
Tu veux que [je fasse quoi ]
je fasse
Verbe_recteur
Analyse et Traitement Informatique de la Langue Française
Limites des constructions étudiées
4
Configuration syntaxique :
Interrogative : qu’est-ce que tu veux que je fasse
Relative : La symbolique de cette oeuvre s'accorde
parfaitement avec le lieu où son auteur a souhaité
qu'elle soit implantée
Clivée : C'est dans ce cadre de service public de proximité
que je pense qu’il faut réfléchir au rôle, au missions et aux
moyens de la police et de la justice.
Constructions en complétive
Analyse et Traitement Informatique de la Langue Française
5
Construction figée ou
variation lexicale ?
Analyse et Traitement Informatique de la Langue Française
Etude de Verhagen (05)
 *Restreinte à la configuration d’interrogative*
Néerlandais : Corpus d’oral (800 000 mots) et de
presse (un an de quotidien)
Nb d’occurrences
Nb de verbes ponts
Denken (penser)
Willen (vouloir)
Zeggen (dire)
Vinden (trouver)
Néerlandais
50
4
41 occ, 82%
5 occ, 10%
2 occ, 4%
2 occ, 4%
Construction majoritaire : « WH- denk- P2 dat » (70%)
Interrogatif + penser + pronom sujet de 2ème personne + que
6
Analyse et Traitement Informatique de la Langue Française
Dąbrowska et al. (2008, 2009, 2010)
 *Restreinte à la configuration d’interrogative*
Construction majoritaire similaire =
« WH- do you think Sentence »
Nb d’occurrences
« WH- do you think S »
BNC
oral
423
67% *
Manchester
ABE
Adulte-enfants enfants
326
44
85%
95%
 ou « WH- did you say » dans 67% BNC*
7
Analyse et Traitement Informatique de la Langue Française
Dąbrowska et al. (2008, 2009, 2010)
BNC
Manchester
ABE
oral Adulte-enfants enfants
Forme prototypique 67% (*)
85%
95%
Une seule modification 29%
13%
2%
Plusieurs modifications
4%
2%
2%
TEMPLATE : WH- do you think Sentence
Une seule modification :
 Wh- did you think …
 Wh- do he think …
 Wh- do you say …
 Wh- do you think that …
 Wh- do you really think …
 récursivité
Plusieurs modifications :
 Wh- did you say …
 Wh- does he think that …
 Wh- do you really say …
 …
*What would Claire believe that Jo thinks he said at the court hearing?
8
Analyse et Traitement Informatique de la Langue Française
Français – interrogatives directes
9
Corpus d’écrit (7,7M mots) et d’oral (2,7M mots)
français contemporain et de France
nombre d’occurrences de CAD
nombre de verbes ponts différents
WH- P2 ‘veux/voulez’ que
français
90
7
65 occ
Qu’est-ce que tu veux que je t’explique
72%
Analyse et Traitement Informatique de la Langue Française
Variation
10
WH- P2 ‘veux/voulez’ que
Présent, indicatif,
pas de négation
65 occ
72%
Une modification
conditionnel : 1 occ
autre sujet: 2 occ
autre verbe : 10 occ
13 occ
14.5%
Plusieurs modifications
temps + verbe + sujet : 2 occ
verbe + sujet : 8 occ
verbe + temps : 1 occ
temps + sujet: 1 occ
12 occ
13%
- Quand vous allez chez le coiffeur, vous espérez
tous que ce sera un professionnel qui vous
coupera les cheveux... Pourquoi voudriez-vous
que ce soit des citoyens, la plupart du temps
desinvestis politiquement, qui décident de
l'avenir d'une nation ? ! ; -)
- Que veut-il que je fasse
- Vers quand tu penses que ce sera
- Dans quel temps va falloir que
je mette de cette phrase
- qui il vaut mieux que je voie
- Pourquoi tu as dit qu’il n’a pas
eu une mort extraordinaire
- Qu’est-ce qu’il voulait que je
fasse
Analyse et Traitement Informatique de la Langue Française
Français : template ?
11
Français
Anglais
(moyenne)
Template
72%
82%
Une modification
14.5%
14.6%
Plusieurs modifications
13%
2.6%
Analyse et Traitement Informatique de la Langue Française
Français : toutes les structures syntaxiques
Relatives, clivées, pseudo-clivées, interrogatives
directes et indirectes
nb d’occurrences de CAD
Nb de verbes pont différents
français
227
33
WH- P2 ‘veux/voulez’ que
70 occ 31%
Une modification
Plusieurs modifications
28 occ 12%
129 occ 57%
12
Analyse et Traitement Informatique de la Langue Française
Français : template ?
nb occurrences CAD
Template :
WH- P2 ‘veux/voulez’ que
Une modification
Plusieurs modifications
Présent, indicatif,
pas de négation
autre mode : 2 occ
autre temps : 1 occ
autre sujet : 8 occ
autre verbe : 17 occ
Tps, mode, neg, verbe, sujet : 1 occ
Verbe, sujet, nég : 1 occ
Mode, verbe, sujet : 5 occ
Tps + verbe + sujet : 25 occ
Sujet + tps + mode : 1 occ
Mode, sujet : 2 occ
Mode, neg : 1 occ
Tps + sujet: 2 occ
verbe + sujet : 88 occ
verbe + tps : 3 occ
13
227 occ
70 occ
31%
28 occ
12%
129 occ
57%
Analyse et Traitement Informatique de la Langue Française
14
Variation stylistique :
contrainte liée aux
genres
Analyse et Traitement Informatique de la Langue Française
Corpus CERF
Corpus Évolutif de Référence du Français : 10M
mots (DELIC, Aix en Provence)
Échantillonnage en 10 tranches de 1M mots :





Divers
Forum Internet
Institutions
Littérature ancienne
Littérature contemporaine





Loisirs et vie pratique
Oral
Politique
Presse
Sciences et techniques
15
Analyse et Traitement Informatique de la Langue Française
Description
Relevé des occurrences en configuration
d’interrogative, de relative, de clivée et de
pseudo-clivée.
Observation des critères suivants :





Nombre d’occurrences des contrôles à distance
La proportion de verbes ponts différents
Type de configuration syntaxique
personne à laquelle le verbe pont est conjugué
Type d’interrogatif-relatif
16
Analyse et Traitement Informatique de la Langue Française
Groupe rouge
17
PRAT
SCIEN
INST
POLI
Nombre CAD
1
4
8
17
Nombre verbes
1
4
7
10
Variété verbes
-
100%
87,5%
58,82%
Vpont le plus
fréquent
penser
-
penser
penser
Configuration
syntaxique
interro
indirecte
rel
rel (75%)
rel (58,8%)
Personne sujet
P3
P2 (50%)
P3b (50%)
P3 (41%)
Type
d’interrogatifrelatif
comment
l-quel- (3)
dont
qu- (3)
où (57%)
l-quel- (2)
l-quel-, comment
dont, comment pourquoi, dont
Analyse et Traitement Informatique de la Langue Française
Groupe bleu
18
LITC
DIVS
ORAL
LITA
Nb CAD
27
28
52
45
Nb verbes
9
8
12
18
Variété V
33,33%
28,57%
23,07%
40%
Vpont
vouloir
vouloir
vouloir
vouloir
Config stxq
Interrogative
directe (52%)
Interrogative
directe (53,5%)
Interrogative
directe (44%)
Relative
(55,5%)
Pers sujet
P2 (44,4%)
P2 (61%)
P2 (42%)
P2 (33%)
Type
d’interrorelatif
qu’est-ce que
(9), que (7),
où (4)
l-quel-, dont,
comment (2)
Qui
qu’est-ce que, que
(6)
qui (5) pk (3)
où, dont (2)
comment,
combien, l-quel-
qu’est-ce que
(15) où(13)
que (6) quel- (3)
qui, qd, pk (2)
l-quel-, combien
où (20),
qu- (14)
l-quel-, dont,
qu’est-ce que,
qui, combien,
pk
Analyse et Traitement Informatique de la Langue Française
Dernier groupe
19
FORUM
PRESSE
Nb CAD
13
10
Nb verbes
8
6
Variété verbes
61,5%
60%
Vpont le plus
fréquent
vouloir
vouloir
Config stxq
interro dir (46%)
interro dir (50%)
Personne sujet
P2 (46%)
P3b (31%)
P2 (50%)
P3 (40%)
Type d’interro-rel
qu- (3)
comment, qu- (3)
pourquoi (2)
où (2)
dont, qu’est-ce que, où, comment qu’est-ce que, dont
Analyse et Traitement Informatique de la Langue Française
Récapitulatif
20
G1
G2
G3
Prat, scien, inst, poli
Forum, presse
Litt, divs, oral
Nb CAD
7.5
11.5
38
Nb verbes
5.5
7
11.8
Variété V
86%
61%
31%
V le +fréq
Penser (26% des occ)
Vouloir (43% occ)
Vouloir (40% occ)
Configurat°
syntaxique
Relative
78% (sans PRAT)
Interro directe
48%
Interro directe
50% (sans LITA)
Pers sujet
P3 / P3b : 53.3%
P2 : 43.4%
P2 : 43.4%
Type
d’interro-rel
comment, l-quel-, dont
: 56%
qu-, qu’est-ce que :
42%
dont, comment :
31.5%
qu’est-ce que, qu- :
46%
Analyse et Traitement Informatique de la Langue Française
Attestations
G1 : PRAT, SCIE, INST, POLI G2 : FORM, PRES
Ex :
Traits
21
G3 : Litt, DIVS,
ORAL
Le conflit pour le salaire
prolonge le rapport de
marchandage dans lequel
chacun sait qu'il a besoin
de l'autre : chacun
s'efforce de rouler l'autre
suffisamment pour avoir
fait une bonne affaire,
mais pas trop sinon le
maintien de la relation
deviendrait incertain.
[SCIE/HermesRev]
Bien sûr, le ciné (du
Qu’est-ce que vous
moins, celui dont je
voulez que je vous
présume que tu parles), dise [Oral]
c'est facile
[FORM/Temoign]
Relative, l-quel-, P3,
variété verbale
Relative, dont, variété.
Interrogative, que, P2,
vouloir.
Ils nous accordent 35%
des recettes fiscales
alors que les charges
grimpent constamment
; que voulez-vous qu'on
fasse avec cela ?
[PRES/Monde Diplo]
Interrogative,
qu’est-ce que, P2,
vouloir
Analyse et Traitement Informatique de la Langue Française
22
Des groupes
hétérogènes
Analyse et Traitement Informatique de la Langue Française
Similitudes G1
Institutionnel
 Parlement canada
(Hansard)
 Sénat
 Assemblée
 ONU
 Parlement européen
23
Politique







Mitterrand
Jospin
PCF
Chirac
PS_etc
Syndicats
Verts
Analyse et Traitement Informatique de la Langue Française
Similitudes G2
Forum
Culture, société, sciences
Économie
Monde
Politique
Média
Société
Sports
Témoignage
24
Presse
Le Monde diplomatique
Courrier international
Le Nouvel observateur
Afrique Sub
L’humanité
Satirique
La Tribune de Genève
Analyse et Traitement Informatique de la Langue Française
Similitudes G3
25
Divers :
Littérature :
Oral :
 Humour
 Chanson
 Religion
 Critique ciné
 Journal intime
 Journal lycéen et
étudiant
 Critique litt
 Théâtre
 Privé,
Informel,
 Poésie
Spontané
 Roman
 Conte
 Érotique
 Correspondance
 Aventure-policier
 Fantastique/horreur
 Nouvelles
 Journal autobio
Analyse et Traitement Informatique de la Langue Française
Différences G1
Institutionnel
 Parlement canada
(Hansard)
 Sénat
 Assemblée
 ONU
 Parlement européen
Sciences/technique
 Manuel technique
 Revue Hermes
 Thèses
26
Politique







Mitterrand
Jospin
PCF
Chirac
PS_etc
Syndicats
Verts
Pratique
• Bourse, finance
Analyse et Traitement Informatique de la Langue Française
Différences G2
Forum
Culture, société,
sciences
Économie
Monde
Politique
Média
Société
Sports
Témoignage
Presse
Le Monde diplomatique
Courrier international
Le Nouvel observateur
Afrique Sub (le Jour_Côte
d’ivoire, L’essor du Mali)
L’humanité
Satirique (Charlie hebdo,
Pour lire Pas lu)
La Tribune de Genève
27
Analyse et Traitement Informatique de la Langue Française
Différences G3
Divers :
Littérature :
 Humour
 Chanson
 Religion
 Critique ciné
 Journal intime
 Journal lycéen et
étudiant
 Critique litt
 Théâtre
 Poésie
 Roman
 Conte
 Erotique
 Correspondance
 Aventure-policier
 Fantastique/horreur
 Nouvelles
 Journal autobio
28
Oral :
Privé,
Informel,
Spontané
Analyse et Traitement Informatique de la Langue Française
29
A quoi correspondent
ces groupes ?
Analyse et Traitement Informatique de la Langue Française
Pas de regroupement habituel « discours élaboré/spontané »
cf G3 : littérature (élaboré), oral (spontané)
sujet SN répartis dans les 3 groupes (poli, scien,
forum, lita)
G1
PRAT
SCIEN
INST
POLI
G2
FORUM
PRESSE
Nb CAD
1
4
8
17
Nb CAD
13
10
Sujet SN
0
0
0
4 (24%)
Sujet SN
1 (8%)
0
G3
LITC
DIVS
ORAL
LITA
Nb CAD
27
28
52
45
Sujet SN
1 (4%)
1 NP (4%)
0
4 (9%)
30
Analyse et Traitement Informatique de la Langue Française
Pas tout à fait « critère formel/informel »
 Inversion S-V :
 + PRES, FORM, LITA, POLI (80-100%)
 - ORAL, LITC, DIVS (0-53%)
 Répartition ‘tu/vous’ quand P2 domine :
SCIEN : vous
PRESSE : vous
FORUM : 4 vous, 1 tu
ORAL : 15 vous, 7 tu
DIVS : 11 vous, 6 tu
LITC : 7 vous, 5 tu
LITA : 12 tu, 3 vous
 Mais type d’interrogatif-relatif :
Qu’est-ce que : informel (G3)
dont, l-quel- : formel (G1)
31
Analyse et Traitement Informatique de la Langue Française
Critère de codification/formalisation
Définition :
La codification est le fait de "mettre des formes",
c'est à dire "donner [...] à un discours la forme
qui est reconnue comme convenable, légitime,
approuvée". (Bourdieu 1986, p43)
Elle permet à la fois l'homogénéisation et la
prévision. "On sait à quoi s'en tenir" (ibid, p.41).
32
Analyse et Traitement Informatique de la Langue Française
(2)
La codification implique une certaine
"objectivation" (p.42). "on y perd en charme..."
(p.42) Avec un texte codifié, la communication
est "minimale" (p.42).
 Les CAD ont pour fonction l’intersubjectivité
(Verhagen 2005) ->peu d’occurrences dans les
textes codifiés (G1).
La codification est opposée au "jeu", à
l'"improvisation", à l'"invention"(p.42,42,43).
 -> beaucoup de CAD dans les fictions, l’humour,
les chansons etc. (G3).
33
Analyse et Traitement Informatique de la Langue Française
Hypothèse
Critère unificateur = critère de codification
 1er groupe = haut degré de codification :
politique, scientifique, institutionnel, pratique
(finance)
 3ème groupe = faible codification : littérature,
oral, divers
 2ème groupe = intermédiaire : forum, presse
34
Analyse et Traitement Informatique de la Langue Française
Confirmation partielle
Le champ littéraire se caractérise par « un très
faible degré de codification » (Bourdieu 1992, p.
370-371 dans Bois)
Plus la codification est forte, mieux le texte
échappera, dans le cours du temps, au
changement ; affaiblie ou inexistante, elle donne
libre cours aux variations, qui ont souvent été
(abusivement) considérées comme
caractéristiques de l’oralité. (Zumthor 2008)
35
Analyse et Traitement Informatique de la Langue Française
Conclusion
Pas de template, mais une déclinaison en fonction
du degré de codification  variation stylistique
Dans les 10 tranches prédéfinies, 3 groupes qui
forment un continuum :
 Très codifié (scientifique, politique, institutionnel,
pratique) : relative « dont/l-quel P3 V que »
 Codifié (presse, forum)
 Peu codifié (littérature, divers, oral) : interrogative
« que/qu’est-ce que P2 V que »
36
Analyse et Traitement Informatique de la Langue Française
Bibliographie
37
Bois Géraldine. Les écrivains aux frontières du champ littéraire. Thèse en cours, Lyon 2.
http://recherche.univ-lyon2.fr/grs/index.php?page=39&notice=14, 05/03/12.
Bourdieu, P. (1986). Habitus, code et codification. Actes de la recherche en sciences sociales,
64(1), 40–44.
Bourdieu, P. (1992). Les Règles de l'art. Genèse et structure du champ littéraire, Paris, Seuil.
Chomsky, N. (1977). On wh-movement. Formal Syntax (eds) Culicover & al., New York: Academic
Press, 71-132.
Dąbrowska, E. (2008). Questions with long-distance dependencies: A usage-based perspective.
Cognitive Linguistics, 19(3), 391–425.
Dąbrowska, E. (2010). Naive v. expert intuitions: An empirical study of acceptability judgments.
The Linguistic Review, 27(1), 1–23.
Dąbrowska, E., Rowland, C., & Theakston, A. (2009). The acquisition of questions with longdistance dependencies. Cognitive Linguistics, 20(3), 571–597.
Erteschik-Shir, N. (1973). On the nature of island constraints. (Thesis). MIT, Cambridge.
http://dspace.mit.edu/handle/1721.1/12991, 10/05/12.
Ross, J. R., (1967). Constraints on Variables in Syntax. (Thesis). MIT, Cambridge.
http://www.eric.ed.gov/PDFS/ED016965.pdf, 03/02/12.
Verhagen, A. (2005). Constructions of Intersubjectivity, Oxford University Press, chap. 3, 119-129.
Zumthor, P. (2008). Oralité. Intermédialités : histoire et théorie des arts, des lettres et des
techniques, (12), 169–202.
Téléchargement