Entre codification et liberté : Variation des constructions de contrôles à distance en français contemporain AFLS, Newcastle, 03/06/12 [email protected] www.atilf.fr Analyse et Traitement Informatique de la Langue Française Langue et variation Sujet : les constructions de contrôles à distance (CAD) en français contemporain Questions : figement ou variation ? Variation stylistique : en fonction de quels critères ? 2 Analyse et Traitement Informatique de la Langue Française Définition des contrôles à distance 3 « Long distance dependencies », « Wh-movement » (Ross 67, Chomsky 77) Qu’est-ce que tu veux que complément_antéposé « Verbe_pont » (Erteschik 73) Tu veux que [je fasse quoi ] je fasse Verbe_recteur Analyse et Traitement Informatique de la Langue Française Limites des constructions étudiées 4 Configuration syntaxique : Interrogative : qu’est-ce que tu veux que je fasse Relative : La symbolique de cette oeuvre s'accorde parfaitement avec le lieu où son auteur a souhaité qu'elle soit implantée Clivée : C'est dans ce cadre de service public de proximité que je pense qu’il faut réfléchir au rôle, au missions et aux moyens de la police et de la justice. Constructions en complétive Analyse et Traitement Informatique de la Langue Française 5 Construction figée ou variation lexicale ? Analyse et Traitement Informatique de la Langue Française Etude de Verhagen (05) *Restreinte à la configuration d’interrogative* Néerlandais : Corpus d’oral (800 000 mots) et de presse (un an de quotidien) Nb d’occurrences Nb de verbes ponts Denken (penser) Willen (vouloir) Zeggen (dire) Vinden (trouver) Néerlandais 50 4 41 occ, 82% 5 occ, 10% 2 occ, 4% 2 occ, 4% Construction majoritaire : « WH- denk- P2 dat » (70%) Interrogatif + penser + pronom sujet de 2ème personne + que 6 Analyse et Traitement Informatique de la Langue Française Dąbrowska et al. (2008, 2009, 2010) *Restreinte à la configuration d’interrogative* Construction majoritaire similaire = « WH- do you think Sentence » Nb d’occurrences « WH- do you think S » BNC oral 423 67% * Manchester ABE Adulte-enfants enfants 326 44 85% 95% ou « WH- did you say » dans 67% BNC* 7 Analyse et Traitement Informatique de la Langue Française Dąbrowska et al. (2008, 2009, 2010) BNC Manchester ABE oral Adulte-enfants enfants Forme prototypique 67% (*) 85% 95% Une seule modification 29% 13% 2% Plusieurs modifications 4% 2% 2% TEMPLATE : WH- do you think Sentence Une seule modification : Wh- did you think … Wh- do he think … Wh- do you say … Wh- do you think that … Wh- do you really think … récursivité Plusieurs modifications : Wh- did you say … Wh- does he think that … Wh- do you really say … … *What would Claire believe that Jo thinks he said at the court hearing? 8 Analyse et Traitement Informatique de la Langue Française Français – interrogatives directes 9 Corpus d’écrit (7,7M mots) et d’oral (2,7M mots) français contemporain et de France nombre d’occurrences de CAD nombre de verbes ponts différents WH- P2 ‘veux/voulez’ que français 90 7 65 occ Qu’est-ce que tu veux que je t’explique 72% Analyse et Traitement Informatique de la Langue Française Variation 10 WH- P2 ‘veux/voulez’ que Présent, indicatif, pas de négation 65 occ 72% Une modification conditionnel : 1 occ autre sujet: 2 occ autre verbe : 10 occ 13 occ 14.5% Plusieurs modifications temps + verbe + sujet : 2 occ verbe + sujet : 8 occ verbe + temps : 1 occ temps + sujet: 1 occ 12 occ 13% - Quand vous allez chez le coiffeur, vous espérez tous que ce sera un professionnel qui vous coupera les cheveux... Pourquoi voudriez-vous que ce soit des citoyens, la plupart du temps desinvestis politiquement, qui décident de l'avenir d'une nation ? ! ; -) - Que veut-il que je fasse - Vers quand tu penses que ce sera - Dans quel temps va falloir que je mette de cette phrase - qui il vaut mieux que je voie - Pourquoi tu as dit qu’il n’a pas eu une mort extraordinaire - Qu’est-ce qu’il voulait que je fasse Analyse et Traitement Informatique de la Langue Française Français : template ? 11 Français Anglais (moyenne) Template 72% 82% Une modification 14.5% 14.6% Plusieurs modifications 13% 2.6% Analyse et Traitement Informatique de la Langue Française Français : toutes les structures syntaxiques Relatives, clivées, pseudo-clivées, interrogatives directes et indirectes nb d’occurrences de CAD Nb de verbes pont différents français 227 33 WH- P2 ‘veux/voulez’ que 70 occ 31% Une modification Plusieurs modifications 28 occ 12% 129 occ 57% 12 Analyse et Traitement Informatique de la Langue Française Français : template ? nb occurrences CAD Template : WH- P2 ‘veux/voulez’ que Une modification Plusieurs modifications Présent, indicatif, pas de négation autre mode : 2 occ autre temps : 1 occ autre sujet : 8 occ autre verbe : 17 occ Tps, mode, neg, verbe, sujet : 1 occ Verbe, sujet, nég : 1 occ Mode, verbe, sujet : 5 occ Tps + verbe + sujet : 25 occ Sujet + tps + mode : 1 occ Mode, sujet : 2 occ Mode, neg : 1 occ Tps + sujet: 2 occ verbe + sujet : 88 occ verbe + tps : 3 occ 13 227 occ 70 occ 31% 28 occ 12% 129 occ 57% Analyse et Traitement Informatique de la Langue Française 14 Variation stylistique : contrainte liée aux genres Analyse et Traitement Informatique de la Langue Française Corpus CERF Corpus Évolutif de Référence du Français : 10M mots (DELIC, Aix en Provence) Échantillonnage en 10 tranches de 1M mots : Divers Forum Internet Institutions Littérature ancienne Littérature contemporaine Loisirs et vie pratique Oral Politique Presse Sciences et techniques 15 Analyse et Traitement Informatique de la Langue Française Description Relevé des occurrences en configuration d’interrogative, de relative, de clivée et de pseudo-clivée. Observation des critères suivants : Nombre d’occurrences des contrôles à distance La proportion de verbes ponts différents Type de configuration syntaxique personne à laquelle le verbe pont est conjugué Type d’interrogatif-relatif 16 Analyse et Traitement Informatique de la Langue Française Groupe rouge 17 PRAT SCIEN INST POLI Nombre CAD 1 4 8 17 Nombre verbes 1 4 7 10 Variété verbes - 100% 87,5% 58,82% Vpont le plus fréquent penser - penser penser Configuration syntaxique interro indirecte rel rel (75%) rel (58,8%) Personne sujet P3 P2 (50%) P3b (50%) P3 (41%) Type d’interrogatifrelatif comment l-quel- (3) dont qu- (3) où (57%) l-quel- (2) l-quel-, comment dont, comment pourquoi, dont Analyse et Traitement Informatique de la Langue Française Groupe bleu 18 LITC DIVS ORAL LITA Nb CAD 27 28 52 45 Nb verbes 9 8 12 18 Variété V 33,33% 28,57% 23,07% 40% Vpont vouloir vouloir vouloir vouloir Config stxq Interrogative directe (52%) Interrogative directe (53,5%) Interrogative directe (44%) Relative (55,5%) Pers sujet P2 (44,4%) P2 (61%) P2 (42%) P2 (33%) Type d’interrorelatif qu’est-ce que (9), que (7), où (4) l-quel-, dont, comment (2) Qui qu’est-ce que, que (6) qui (5) pk (3) où, dont (2) comment, combien, l-quel- qu’est-ce que (15) où(13) que (6) quel- (3) qui, qd, pk (2) l-quel-, combien où (20), qu- (14) l-quel-, dont, qu’est-ce que, qui, combien, pk Analyse et Traitement Informatique de la Langue Française Dernier groupe 19 FORUM PRESSE Nb CAD 13 10 Nb verbes 8 6 Variété verbes 61,5% 60% Vpont le plus fréquent vouloir vouloir Config stxq interro dir (46%) interro dir (50%) Personne sujet P2 (46%) P3b (31%) P2 (50%) P3 (40%) Type d’interro-rel qu- (3) comment, qu- (3) pourquoi (2) où (2) dont, qu’est-ce que, où, comment qu’est-ce que, dont Analyse et Traitement Informatique de la Langue Française Récapitulatif 20 G1 G2 G3 Prat, scien, inst, poli Forum, presse Litt, divs, oral Nb CAD 7.5 11.5 38 Nb verbes 5.5 7 11.8 Variété V 86% 61% 31% V le +fréq Penser (26% des occ) Vouloir (43% occ) Vouloir (40% occ) Configurat° syntaxique Relative 78% (sans PRAT) Interro directe 48% Interro directe 50% (sans LITA) Pers sujet P3 / P3b : 53.3% P2 : 43.4% P2 : 43.4% Type d’interro-rel comment, l-quel-, dont : 56% qu-, qu’est-ce que : 42% dont, comment : 31.5% qu’est-ce que, qu- : 46% Analyse et Traitement Informatique de la Langue Française Attestations G1 : PRAT, SCIE, INST, POLI G2 : FORM, PRES Ex : Traits 21 G3 : Litt, DIVS, ORAL Le conflit pour le salaire prolonge le rapport de marchandage dans lequel chacun sait qu'il a besoin de l'autre : chacun s'efforce de rouler l'autre suffisamment pour avoir fait une bonne affaire, mais pas trop sinon le maintien de la relation deviendrait incertain. [SCIE/HermesRev] Bien sûr, le ciné (du Qu’est-ce que vous moins, celui dont je voulez que je vous présume que tu parles), dise [Oral] c'est facile [FORM/Temoign] Relative, l-quel-, P3, variété verbale Relative, dont, variété. Interrogative, que, P2, vouloir. Ils nous accordent 35% des recettes fiscales alors que les charges grimpent constamment ; que voulez-vous qu'on fasse avec cela ? [PRES/Monde Diplo] Interrogative, qu’est-ce que, P2, vouloir Analyse et Traitement Informatique de la Langue Française 22 Des groupes hétérogènes Analyse et Traitement Informatique de la Langue Française Similitudes G1 Institutionnel Parlement canada (Hansard) Sénat Assemblée ONU Parlement européen 23 Politique Mitterrand Jospin PCF Chirac PS_etc Syndicats Verts Analyse et Traitement Informatique de la Langue Française Similitudes G2 Forum Culture, société, sciences Économie Monde Politique Média Société Sports Témoignage 24 Presse Le Monde diplomatique Courrier international Le Nouvel observateur Afrique Sub L’humanité Satirique La Tribune de Genève Analyse et Traitement Informatique de la Langue Française Similitudes G3 25 Divers : Littérature : Oral : Humour Chanson Religion Critique ciné Journal intime Journal lycéen et étudiant Critique litt Théâtre Privé, Informel, Poésie Spontané Roman Conte Érotique Correspondance Aventure-policier Fantastique/horreur Nouvelles Journal autobio Analyse et Traitement Informatique de la Langue Française Différences G1 Institutionnel Parlement canada (Hansard) Sénat Assemblée ONU Parlement européen Sciences/technique Manuel technique Revue Hermes Thèses 26 Politique Mitterrand Jospin PCF Chirac PS_etc Syndicats Verts Pratique • Bourse, finance Analyse et Traitement Informatique de la Langue Française Différences G2 Forum Culture, société, sciences Économie Monde Politique Média Société Sports Témoignage Presse Le Monde diplomatique Courrier international Le Nouvel observateur Afrique Sub (le Jour_Côte d’ivoire, L’essor du Mali) L’humanité Satirique (Charlie hebdo, Pour lire Pas lu) La Tribune de Genève 27 Analyse et Traitement Informatique de la Langue Française Différences G3 Divers : Littérature : Humour Chanson Religion Critique ciné Journal intime Journal lycéen et étudiant Critique litt Théâtre Poésie Roman Conte Erotique Correspondance Aventure-policier Fantastique/horreur Nouvelles Journal autobio 28 Oral : Privé, Informel, Spontané Analyse et Traitement Informatique de la Langue Française 29 A quoi correspondent ces groupes ? Analyse et Traitement Informatique de la Langue Française Pas de regroupement habituel « discours élaboré/spontané » cf G3 : littérature (élaboré), oral (spontané) sujet SN répartis dans les 3 groupes (poli, scien, forum, lita) G1 PRAT SCIEN INST POLI G2 FORUM PRESSE Nb CAD 1 4 8 17 Nb CAD 13 10 Sujet SN 0 0 0 4 (24%) Sujet SN 1 (8%) 0 G3 LITC DIVS ORAL LITA Nb CAD 27 28 52 45 Sujet SN 1 (4%) 1 NP (4%) 0 4 (9%) 30 Analyse et Traitement Informatique de la Langue Française Pas tout à fait « critère formel/informel » Inversion S-V : + PRES, FORM, LITA, POLI (80-100%) - ORAL, LITC, DIVS (0-53%) Répartition ‘tu/vous’ quand P2 domine : SCIEN : vous PRESSE : vous FORUM : 4 vous, 1 tu ORAL : 15 vous, 7 tu DIVS : 11 vous, 6 tu LITC : 7 vous, 5 tu LITA : 12 tu, 3 vous Mais type d’interrogatif-relatif : Qu’est-ce que : informel (G3) dont, l-quel- : formel (G1) 31 Analyse et Traitement Informatique de la Langue Française Critère de codification/formalisation Définition : La codification est le fait de "mettre des formes", c'est à dire "donner [...] à un discours la forme qui est reconnue comme convenable, légitime, approuvée". (Bourdieu 1986, p43) Elle permet à la fois l'homogénéisation et la prévision. "On sait à quoi s'en tenir" (ibid, p.41). 32 Analyse et Traitement Informatique de la Langue Française (2) La codification implique une certaine "objectivation" (p.42). "on y perd en charme..." (p.42) Avec un texte codifié, la communication est "minimale" (p.42). Les CAD ont pour fonction l’intersubjectivité (Verhagen 2005) ->peu d’occurrences dans les textes codifiés (G1). La codification est opposée au "jeu", à l'"improvisation", à l'"invention"(p.42,42,43). -> beaucoup de CAD dans les fictions, l’humour, les chansons etc. (G3). 33 Analyse et Traitement Informatique de la Langue Française Hypothèse Critère unificateur = critère de codification 1er groupe = haut degré de codification : politique, scientifique, institutionnel, pratique (finance) 3ème groupe = faible codification : littérature, oral, divers 2ème groupe = intermédiaire : forum, presse 34 Analyse et Traitement Informatique de la Langue Française Confirmation partielle Le champ littéraire se caractérise par « un très faible degré de codification » (Bourdieu 1992, p. 370-371 dans Bois) Plus la codification est forte, mieux le texte échappera, dans le cours du temps, au changement ; affaiblie ou inexistante, elle donne libre cours aux variations, qui ont souvent été (abusivement) considérées comme caractéristiques de l’oralité. (Zumthor 2008) 35 Analyse et Traitement Informatique de la Langue Française Conclusion Pas de template, mais une déclinaison en fonction du degré de codification variation stylistique Dans les 10 tranches prédéfinies, 3 groupes qui forment un continuum : Très codifié (scientifique, politique, institutionnel, pratique) : relative « dont/l-quel P3 V que » Codifié (presse, forum) Peu codifié (littérature, divers, oral) : interrogative « que/qu’est-ce que P2 V que » 36 Analyse et Traitement Informatique de la Langue Française Bibliographie 37 Bois Géraldine. Les écrivains aux frontières du champ littéraire. Thèse en cours, Lyon 2. http://recherche.univ-lyon2.fr/grs/index.php?page=39&notice=14, 05/03/12. Bourdieu, P. (1986). Habitus, code et codification. Actes de la recherche en sciences sociales, 64(1), 40–44. Bourdieu, P. (1992). Les Règles de l'art. Genèse et structure du champ littéraire, Paris, Seuil. Chomsky, N. (1977). On wh-movement. Formal Syntax (eds) Culicover & al., New York: Academic Press, 71-132. Dąbrowska, E. (2008). Questions with long-distance dependencies: A usage-based perspective. Cognitive Linguistics, 19(3), 391–425. Dąbrowska, E. (2010). Naive v. expert intuitions: An empirical study of acceptability judgments. The Linguistic Review, 27(1), 1–23. Dąbrowska, E., Rowland, C., & Theakston, A. (2009). The acquisition of questions with longdistance dependencies. Cognitive Linguistics, 20(3), 571–597. Erteschik-Shir, N. (1973). On the nature of island constraints. (Thesis). MIT, Cambridge. http://dspace.mit.edu/handle/1721.1/12991, 10/05/12. Ross, J. R., (1967). Constraints on Variables in Syntax. (Thesis). MIT, Cambridge. http://www.eric.ed.gov/PDFS/ED016965.pdf, 03/02/12. Verhagen, A. (2005). Constructions of Intersubjectivity, Oxford University Press, chap. 3, 119-129. Zumthor, P. (2008). Oralité. Intermédialités : histoire et théorie des arts, des lettres et des techniques, (12), 169–202.