Etudes de syntaxe : français parlé, français hors de France, créoles Actes du colloque franco-allemand, Paris X, le 19 octobre 2007 Que peuvent nous apprendre en syntaxe des corpus oraux anciens ? Paul Cappeau Université de Poitiers – FoReLL La question du changement en linguistique est un phénomène qui a donné lieu à quantité de travaux que je n'évoquerai pas afin de ne pas réduire cette courte présentation écrite à un relevé bibliographique. Dans le domaine de la syntaxe française, on peut trouver dans divers ouvrages qui traitent de l'histoire de la langue française (Chaurand : 1999, Antoine & Martin : 1995) le relevé de quelques faits qui seraient sensibles à une certaine évolution (la liaison, la négation, les relatifs). Dans le présent travail j'ai souhaité adopté un angle légèrement différent : d'une part en insistant sur la démarche suivie (le “comment faire”) au détriment de résultats spectaculaires, d'autre part en cherchant quels faits émergeaient des données (une fois que les faits “classiques” avaient été écartés), enfin en ne recherchant pas forcément des nouveautés, des structures apparues récemment, mais plutôt en me demandant si certaines tournures attestées dans mon corpus “ancien” pouvaient être facilement retrouvées dans des données contemporaines. J'adopterai finalement la position d'un éditeur de corpus oraux (en l'occurrence il s'agit du corpus Phonothèque qui sera présenté plus en détail dans la partie suivante), soucieux de présenter les données collectées et de montrer l'exploitation qu'il peut en tirer. I. Les difficultés de l'entreprise Je retiendrai quatre difficultés majeures qui me permettront de présenter plus avant le corpus utilisé et de défendre l'orientation suivie dans ce travail. Recul chronologique réduit Le corpus Phonothèque qui est à la source de cette recherche est constitué d'interviews conduites par Francine Bloch. Il s'agissait pour elle d'interroger divers artistes (en majorité liés au domaine musical) 1 sur leur parcours. Ces entretiens étaient accessibles au public de la Phonothèque française . Les enregistrements sur lesquels j'ai travaillé ont été collectés entre 1958 et 1979, ce qui fait un recul de 30 à 50 ans. On mesure facilement que le caractère “ancien” est ici fort limité dans le temps. Deux réponses peuvent être apportées à cette première critique. Il faut considérer que pour les corpus oraux, ce terme ancien ne peut avoir la même amplitude que pour les documents écrits. Travailler sur des données vieilles de 50 ans présente donc un intérêt certain. De plus, si l'on s'intéresse à l'âge virtuel des locuteurs interviewés (c'est-à-dire à leur date de naissance ou à l'âge qu'ils auraient s'ils avaient vécu jusqu'à aujourd'hui), le corpus dévoile sa richesse puisque les âges s'étalent de 83 ans à 125 ans. La taille des données Douze personnalités ont été interviewées. Le corpus transcrit comporte 66 000 mots, ce qui correspond à 5h 15 de son. Il s'agit manifestement d'un petit corpus. Mais là encore il convient d'être plus nuancé dans le regard porté sur ces données. Il est inutile de rappeler que les corpus oraux sont souvent d'une taille réduite (qui tient pour une bonne part au lourd travail de transcription et de vérification qu'il nécessite). La taille indiquée doit donc être évaluée à cette aune. Mais de plus, le corpus Phonothèque n'est qu'une partie (certes essentielle) des données exploitées. En effet, la recherche de changements suppose de travailler sur des données contemporaines pour pouvoir identifier des décalages éventuels. Pour cela j'ai pu 2 m'appuyer sur le CRFP (Corpus de Référence du Français Parlé ) qui comporte 440 000 mots et dans certains cas particuliers lancer des recherches sur le web pour tester certaines hypothèses. Les données exploitables n'ont donc pas été confinées à celles du corpus Phonothèque. 1 Les enregistrements sont conservés à la BnF. Je tiens à exprimer tous mes remerciements à Pascal Cordereix (conservateur à la BnF) qui m'a grandement facilité l'accès à ces documents. 2 Je renvoie à Recherches Sur le Français Parlé N° 18 pour une présentation détaillée de ce corpus. 1 Etudes de syntaxe : français parlé, français hors de France, créoles Actes du colloque franco-allemand, Paris X, le 19 octobre 2007 Domaine observé a priori peu sensible Vouloir identifier des changements syntaxiques semble une entreprise plutôt incertaine si l'on tient compte des deux paramètres précédents. En effet, les modifications dans la syntaxe semblent demander du temps, un temps plus important que celui que les données consultées offre : Il est difficile de dire s’il y a eu, entre 1914 et 1945, de réels changements dans la syntaxe du français. C’est un laps de temps un peu court pour y voir des évolutions qui, en ce domaine, sont habituellement lentes. (Blanche-Benveniste : 1995) Toutefois certains travaux antérieurs (comme Yaguello : 1998) ont pu mettre en lumière des évolutions intéressantes (ainsi l'emploi de genre qui devient un outil grammatical dans un exemple tel que ça fait genre trois cents kilomètres). D'autre part, la problématique adoptée atténue cette réserve : il ne s'agit pas de rechercher des nouveautés mais plutôt des modifications ou des disparitions dans la syntaxe (se demander si des faits attestés dans le corpus Phonothèque continuent à être observés de nos jours). Questions sur l'homogénéité du corpus La question portant sur le statut du corpus demanderait à être bien plus développée notamment parce qu'elle est d'actualité à une époque où se multiplient les constitutions de corpus et où la différence entre corpus et archive (bien identifiée en théorie cf. Rastier : 2005 ou McEnery et alii :2006) tend à être négligée ou abandonnée dans la réalité des pratiques (Cappeau & Gadet : 2007). Pour faire court, disons simplement que si de nombreux paramètres conduisent à considérer que les enregistrements rassemblés ont bien droit à l'appellation de corpus (une seule intervieweuse, des personnalités souvent proches du milieu musical, des buts probablement voisins lors du recueil, des entretiens généralement faits à domicile…), il n'en reste pas moins que l'homogénéité que le titre Phonothèque laisse attendre n'est que très partielle. Ainsi les interviews peuvent se présenter sous forme de dialogues fréquemment entrecoupés ou laisser au locuteur la possibilité de prises de parole longues (plus proches de narrations). D'une certaine façon l'homogénéité semble plus reposer sur des critères externes que sur des paramètres internes (qui demanderaient d'ailleurs à être identifiés par l'analyse). Cette difficulté à identifier les paramètres pertinents sur lesquels s'appuyer est d'ailleurs bien connue : Ainsi, plus que directement sur les données, il faudrait mettre l’accent de la comparaison sur les situations et les contextes dans lesquels elles ont été produites. (Gadet : 2006) Dans ce travail, l'appui sur le CRFP a permis de disposer de données regroupées en situations de parole pour tester certaines hypothèses (vérifier notamment que le corpus Phonothèque présente une langue plutôt formelle que la situation laissait attendre). III. Quelques pistes Trois aspects différents liés à la syntaxe ont été observés : les tournures, la distribution de certains éléments, l'organisation syntaxique de passages longs. Seul le premier sera décrit dans cette version écrite. Les tournures Plusieurs questions rendent l'analyse délicate : avec un corpus de taille modeste, on ne peut s'attendre à rencontrer qu'un nombre faible d'attestations d'une même tournure, on peut alors des demander si la présence ou l'absence d'une tournure est réellement significative, révélatrice, enfin travailler sur une tournure ou une expression conduit à s'interroger sur le partage entre lexique et syntaxe. L'exemple qui suit illustre bien les questions soulevées ci-dessus : - j'ai rencontré de vos élèves de vos amis (Phonothèque) C'est le seul exemple de cette construction qui a été rencontré dans le corpus Phonothèque. Mais la réitération observée du complément (de vos élèves de vos amis) incite à considérer que la structure n'est pas due à une maladresse du locuteur. Cette construction évoque la description que Bonnard (1978) propose pour le partitif. Il indique que deux formes ont été en concurrence : mangier pain et mangier de pain. Une concurrence semble pouvoir être posée entre rencontrer vos amis et rencontrer de vos amis. Trouver des exemples sur ce modèle dans d'autres corpus oraux est particulièrement ardu (car il est difficile de savoir quel lexique verbal doit être utilisé, on a donc choisi de travailler avec manger et rencontrer). Le CRFP par exemple ne donne aucun résultat (ce qui n'est pas surprenant). Une issue envisageable est de se tourner vers le web. Le tableau suivant indique les résultats obtenus : 2 Etudes de syntaxe : français parlé, français hors de France, créoles Actes du colloque franco-allemand, Paris X, le 19 octobre 2007 Construction directe manger ces gâteaux rencontrer vos amis Construction “partitive” 28 cas manger de ces gâteaux 4 cas 13 400 cas rencontrer de vos amis 0 cas Occurrences trouvées sur le web Ces résultats ne fournissent pas de certitude (telle n'était pas vraiment l'attente d'ailleurs) mais soulèvent des questions intéressantes : a) La construction “partitive” semble ne plus exister avec le verbe rencontrer (on pourrait dire qu'elle persiste pour les gâteaux avec le verbe manger - encore que le nombre d'occurrences soit faible - mais qu'elle n'a pas survécu avec du lexique humain). b) Cette construction a-t-elle été vraiment développée ? La recherche sur Frantext apporte une information supplémentaire, la construction “rencontrer de vos” n'est pas plus abondante dans 3 l'écrit littéraire . Un seul exemple a pu être retenu : - Ainsi vous ne risquerez pas de rencontrer de vos camarades. (Montherlant) c) D'où une dernière question : s'agit-il d'une construction limitée à quelques verbes bien particuliers (dont un seul a été observé dans le corpus Phonothèque) ou bien la construction observée n'est-elle qu'un idiolecte ? La distribution de certaines unités Le corpus Phonothèque présente un emploi intéressant des participes présents comme dans : - car ma mère aimant la musique terriblement elle était très très bonne musicienne (Phonothèque) Les exemples rencontrés dans le CRFP relèvent d'emplois différents comme dans : - il s’agit là du 3ème attentat s’abattant sur la capitale (CRFP) Dans cet énoncé, le participe présent est directement dans la dépendance du nom (qu'il doit donc suivre). Il semblerait que ce soit là un secteur où la syntaxe a “bougé” : des emplois (avec une proposition participiale) qui se rencontraient à l'oral semblent cantonnés, de nos jours, à la langue écrite L'organisation de passages longs Ce dernier point permet de s'intéresser aux phénomènes de planification de la production. Les locuteurs produisent des listes étendues qui excèdent (en nombre d'éléments listés) ce que l'on observe dans les productions actuelles. En voici un exemple : - il ne jouait pas du tout à l’homme majestueux au maître pas du tout il était vraiment l’homme le plus courtois l’homme le plus aimable l’homme le plus charmant l’homme le plus discret et avec tout cela je vous dis cette espèce de mystère qui l’entourait et qui est devenu de plus en plus grand plus en plus à mesure que je le connaissais (Phonothèque) Ce type de passage développé possède une organisation interne qui semble pouvoir être reliée à la formation reçue (Chervel : 1998). Il est probable que des modèles rhétoriques sous-jacents influencent la maîtrise de ces régularités. Ce bref aperçu visait à esquisser des pistes de description que les corpus offrent. Incidemment, il a permis de mettre en valeur l'intérêt du patrimoine (des productions plus ou moins disponibles parfois oubliées, quelquefois négligées qu'il faudrait songer à exhumer). 3 Cette observation a été faite à la suite de réactions à la version orale de cette communication. Je remercie ces auditeurs attentifs. Le résultat observé me renforce dans l'idée que l'intuition est un sentiment souvent fragile… 3 Etudes de syntaxe : français parlé, français hors de France, créoles Actes du colloque franco-allemand, Paris X, le 19 octobre 2007 Bibliographie Blanche-Benveniste, Claire. 1995. “Quelques faits de syntaxe” dans Antoine, Gérald & Martin, Robert (éds). Histoire de la langue française 1914-1945. Paris. CNRS-Editions. 125-147. Bonnard, Henri. 1978. “Article” dans Grand Larousse de la langue française. Paris. Larousse. 258260. Cappeau, Paul & Gadet, Françoise. 2007. “L’exploitation sociolinguistique des grands corpus. Maître mot et pierre philosophale”. Revue Française de Linguistique Appliquée. XII-1 : 99-110. Chaurand, Jacques. 1999. Nouvelle histoire de la langue française. Paris. Le Seuil. Chervel, André. 1998. La culture scolaire. Une approche historique. Paris. Belin. Gadet, Françoise. 2006. “Hier comme aujourd’hui. Quelques faits de variation en syntaxe” dans Guillot, Céline et alii (éds). A la quête du sens. Etudes littéraires, historiques et linguistiques en hommage à Christiane Marchello-Nizia. Paris. ENS Editions. 191-197. McEnery, Tony, Xia, Richard & Tono, Yukio. 2006. Corpus-Based Language Studies. An advanced resource book. New York. Routledge Applied Linguistics. Rastier, François. 2005. “Enjeux épistémologiques de la linguistique de corpus” dans Williams, Geoffrey (éd). La linguistique de corpus. Rennes. PUR. 31-45. Yaguello, Marina. 1998. Petits faits de langue. Paris. Le Seuil. “Autour du corpus de référence du français parlé”. 2004. Recherches Sur le Français Parlé. 18. 4