Télécharger

publicité
Etudes de syntaxe : français parlé, français hors de France, créoles
Actes du colloque franco-allemand, Paris X, le 19 octobre 2007
Que peuvent nous apprendre en syntaxe des corpus oraux
anciens ?
Paul Cappeau
Université de Poitiers – FoReLL
La question du changement en linguistique est un phénomène qui a donné lieu à quantité de travaux
que je n'évoquerai pas afin de ne pas réduire cette courte présentation écrite à un relevé
bibliographique. Dans le domaine de la syntaxe française, on peut trouver dans divers ouvrages qui
traitent de l'histoire de la langue française (Chaurand : 1999, Antoine & Martin : 1995) le relevé de
quelques faits qui seraient sensibles à une certaine évolution (la liaison, la négation, les relatifs). Dans
le présent travail j'ai souhaité adopté un angle légèrement différent : d'une part en insistant sur la
démarche suivie (le “comment faire”) au détriment de résultats spectaculaires, d'autre part en
cherchant quels faits émergeaient des données (une fois que les faits “classiques” avaient été
écartés), enfin en ne recherchant pas forcément des nouveautés, des structures apparues
récemment, mais plutôt en me demandant si certaines tournures attestées dans mon corpus “ancien”
pouvaient être facilement retrouvées dans des données contemporaines. J'adopterai finalement la
position d'un éditeur de corpus oraux (en l'occurrence il s'agit du corpus Phonothèque qui sera
présenté plus en détail dans la partie suivante), soucieux de présenter les données collectées et de
montrer l'exploitation qu'il peut en tirer.
I. Les difficultés de l'entreprise
Je retiendrai quatre difficultés majeures qui me permettront de présenter plus avant le corpus utilisé et
de défendre l'orientation suivie dans ce travail.
Recul chronologique réduit
Le corpus Phonothèque qui est à la source de cette recherche est constitué d'interviews conduites par
Francine Bloch. Il s'agissait pour elle d'interroger divers artistes (en majorité liés au domaine musical)
1
sur leur parcours. Ces entretiens étaient accessibles au public de la Phonothèque française . Les
enregistrements sur lesquels j'ai travaillé ont été collectés entre 1958 et 1979, ce qui fait un recul de
30 à 50 ans. On mesure facilement que le caractère “ancien” est ici fort limité dans le temps.
Deux réponses peuvent être apportées à cette première critique. Il faut considérer que pour les corpus
oraux, ce terme ancien ne peut avoir la même amplitude que pour les documents écrits. Travailler sur
des données vieilles de 50 ans présente donc un intérêt certain. De plus, si l'on s'intéresse à l'âge
virtuel des locuteurs interviewés (c'est-à-dire à leur date de naissance ou à l'âge qu'ils auraient s'ils
avaient vécu jusqu'à aujourd'hui), le corpus dévoile sa richesse puisque les âges s'étalent de 83 ans à
125 ans.
La taille des données
Douze personnalités ont été interviewées. Le corpus transcrit comporte 66 000 mots, ce qui
correspond à 5h 15 de son. Il s'agit manifestement d'un petit corpus. Mais là encore il convient d'être
plus nuancé dans le regard porté sur ces données.
Il est inutile de rappeler que les corpus oraux sont souvent d'une taille réduite (qui tient pour une
bonne part au lourd travail de transcription et de vérification qu'il nécessite). La taille indiquée doit
donc être évaluée à cette aune. Mais de plus, le corpus Phonothèque n'est qu'une partie (certes
essentielle) des données exploitées. En effet, la recherche de changements suppose de travailler sur
des données contemporaines pour pouvoir identifier des décalages éventuels. Pour cela j'ai pu
2
m'appuyer sur le CRFP (Corpus de Référence du Français Parlé ) qui comporte 440 000 mots et dans
certains cas particuliers lancer des recherches sur le web pour tester certaines hypothèses. Les
données exploitables n'ont donc pas été confinées à celles du corpus Phonothèque.
1
Les enregistrements sont conservés à la BnF. Je tiens à exprimer tous mes remerciements à Pascal Cordereix (conservateur
à la BnF) qui m'a grandement facilité l'accès à ces documents.
2
Je renvoie à Recherches Sur le Français Parlé N° 18 pour une présentation détaillée de ce corpus.
1
Etudes de syntaxe : français parlé, français hors de France, créoles
Actes du colloque franco-allemand, Paris X, le 19 octobre 2007
Domaine observé a priori peu sensible
Vouloir identifier des changements syntaxiques semble une entreprise plutôt incertaine si l'on tient
compte des deux paramètres précédents. En effet, les modifications dans la syntaxe semblent
demander du temps, un temps plus important que celui que les données consultées offre :
Il est difficile de dire s’il y a eu, entre 1914 et 1945, de réels changements dans la
syntaxe du français. C’est un laps de temps un peu court pour y voir des évolutions qui,
en ce domaine, sont habituellement lentes. (Blanche-Benveniste : 1995)
Toutefois certains travaux antérieurs (comme Yaguello : 1998) ont pu mettre en lumière des
évolutions intéressantes (ainsi l'emploi de genre qui devient un outil grammatical dans un exemple tel
que ça fait genre trois cents kilomètres). D'autre part, la problématique adoptée atténue cette réserve :
il ne s'agit pas de rechercher des nouveautés mais plutôt des modifications ou des disparitions dans la
syntaxe (se demander si des faits attestés dans le corpus Phonothèque continuent à être observés de
nos jours).
Questions sur l'homogénéité du corpus
La question portant sur le statut du corpus demanderait à être bien plus développée notamment parce
qu'elle est d'actualité à une époque où se multiplient les constitutions de corpus et où la différence
entre corpus et archive (bien identifiée en théorie cf. Rastier : 2005 ou McEnery et alii :2006) tend à
être négligée ou abandonnée dans la réalité des pratiques (Cappeau & Gadet : 2007). Pour faire
court, disons simplement que si de nombreux paramètres conduisent à considérer que les
enregistrements rassemblés ont bien droit à l'appellation de corpus (une seule intervieweuse, des
personnalités souvent proches du milieu musical, des buts probablement voisins lors du recueil, des
entretiens généralement faits à domicile…), il n'en reste pas moins que l'homogénéité que le titre
Phonothèque laisse attendre n'est que très partielle. Ainsi les interviews peuvent se présenter sous
forme de dialogues fréquemment entrecoupés ou laisser au locuteur la possibilité de prises de parole
longues (plus proches de narrations). D'une certaine façon l'homogénéité semble plus reposer sur des
critères externes que sur des paramètres internes (qui demanderaient d'ailleurs à être identifiés par
l'analyse). Cette difficulté à identifier les paramètres pertinents sur lesquels s'appuyer est d'ailleurs
bien connue :
Ainsi, plus que directement sur les données, il faudrait mettre l’accent de la comparaison
sur les situations et les contextes dans lesquels elles ont été produites. (Gadet : 2006)
Dans ce travail, l'appui sur le CRFP a permis de disposer de données regroupées en situations de
parole pour tester certaines hypothèses (vérifier notamment que le corpus Phonothèque présente une
langue plutôt formelle que la situation laissait attendre).
III. Quelques pistes
Trois aspects différents liés à la syntaxe ont été observés : les tournures, la distribution de certains
éléments, l'organisation syntaxique de passages longs. Seul le premier sera décrit dans cette version
écrite.
Les tournures
Plusieurs questions rendent l'analyse délicate : avec un corpus de taille modeste, on ne peut
s'attendre à rencontrer qu'un nombre faible d'attestations d'une même tournure, on peut alors des
demander si la présence ou l'absence d'une tournure est réellement significative, révélatrice, enfin
travailler sur une tournure ou une expression conduit à s'interroger sur le partage entre lexique et
syntaxe. L'exemple qui suit illustre bien les questions soulevées ci-dessus :
- j'ai rencontré de vos élèves de vos amis (Phonothèque)
C'est le seul exemple de cette construction qui a été rencontré dans le corpus Phonothèque. Mais la
réitération observée du complément (de vos élèves de vos amis) incite à considérer que la structure
n'est pas due à une maladresse du locuteur. Cette construction évoque la description que Bonnard
(1978) propose pour le partitif. Il indique que deux formes ont été en concurrence : mangier pain et
mangier de pain. Une concurrence semble pouvoir être posée entre rencontrer vos amis et rencontrer
de vos amis. Trouver des exemples sur ce modèle dans d'autres corpus oraux est particulièrement
ardu (car il est difficile de savoir quel lexique verbal doit être utilisé, on a donc choisi de travailler avec
manger et rencontrer). Le CRFP par exemple ne donne aucun résultat (ce qui n'est pas surprenant).
Une issue envisageable est de se tourner vers le web. Le tableau suivant indique les résultats
obtenus :
2
Etudes de syntaxe : français parlé, français hors de France, créoles
Actes du colloque franco-allemand, Paris X, le 19 octobre 2007
Construction directe
manger ces gâteaux
rencontrer vos amis
Construction “partitive”
28 cas
manger de ces gâteaux 4 cas
13 400 cas
rencontrer de vos amis 0 cas
Occurrences trouvées sur le web
Ces résultats ne fournissent pas de certitude (telle n'était pas vraiment l'attente d'ailleurs) mais
soulèvent des questions intéressantes :
a) La construction “partitive” semble ne plus exister avec le verbe rencontrer (on pourrait dire
qu'elle persiste pour les gâteaux avec le verbe manger - encore que le nombre d'occurrences soit
faible - mais qu'elle n'a pas survécu avec du lexique humain).
b) Cette construction a-t-elle été vraiment développée ? La recherche sur Frantext apporte une
information supplémentaire, la construction “rencontrer de vos” n'est pas plus abondante dans
3
l'écrit littéraire . Un seul exemple a pu être retenu :
- Ainsi vous ne risquerez pas de rencontrer de vos camarades. (Montherlant)
c) D'où une dernière question : s'agit-il d'une construction limitée à quelques verbes bien
particuliers (dont un seul a été observé dans le corpus Phonothèque) ou bien la construction
observée n'est-elle qu'un idiolecte ?
La distribution de certaines unités
Le corpus Phonothèque présente un emploi intéressant des participes présents comme dans :
- car ma mère aimant la musique terriblement elle était très très bonne musicienne (Phonothèque)
Les exemples rencontrés dans le CRFP relèvent d'emplois différents comme dans :
- il s’agit là du 3ème attentat s’abattant sur la capitale (CRFP)
Dans cet énoncé, le participe présent est directement dans la dépendance du nom (qu'il doit donc
suivre).
Il semblerait que ce soit là un secteur où la syntaxe a “bougé” : des emplois (avec une proposition
participiale) qui se rencontraient à l'oral semblent cantonnés, de nos jours, à la langue écrite
L'organisation de passages longs
Ce dernier point permet de s'intéresser aux phénomènes de planification de la production. Les
locuteurs produisent des listes étendues qui excèdent (en nombre d'éléments listés) ce que l'on
observe dans les productions actuelles. En voici un exemple :
- il ne jouait pas du tout à l’homme majestueux au maître pas du tout il était vraiment l’homme le
plus courtois l’homme le plus aimable l’homme le plus charmant l’homme le plus discret et avec
tout cela je vous dis cette espèce de mystère qui l’entourait et qui est devenu de plus en plus
grand plus en plus à mesure que je le connaissais (Phonothèque)
Ce type de passage développé possède une organisation interne qui semble pouvoir être reliée à la
formation reçue (Chervel : 1998). Il est probable que des modèles rhétoriques sous-jacents
influencent la maîtrise de ces régularités.
Ce bref aperçu visait à esquisser des pistes de description que les corpus offrent. Incidemment, il a
permis de mettre en valeur l'intérêt du patrimoine (des productions plus ou moins disponibles parfois
oubliées, quelquefois négligées qu'il faudrait songer à exhumer).
3
Cette observation a été faite à la suite de réactions à la version orale de cette communication. Je remercie ces auditeurs
attentifs. Le résultat observé me renforce dans l'idée que l'intuition est un sentiment souvent fragile…
3
Etudes de syntaxe : français parlé, français hors de France, créoles
Actes du colloque franco-allemand, Paris X, le 19 octobre 2007
Bibliographie
Blanche-Benveniste, Claire. 1995. “Quelques faits de syntaxe” dans Antoine, Gérald & Martin, Robert
(éds). Histoire de la langue française 1914-1945. Paris. CNRS-Editions. 125-147.
Bonnard, Henri. 1978. “Article” dans Grand Larousse de la langue française. Paris. Larousse. 258260.
Cappeau, Paul & Gadet, Françoise. 2007. “L’exploitation sociolinguistique des grands corpus. Maître
mot et pierre philosophale”. Revue Française de Linguistique Appliquée. XII-1 : 99-110.
Chaurand, Jacques. 1999. Nouvelle histoire de la langue française. Paris. Le Seuil.
Chervel, André. 1998. La culture scolaire. Une approche historique. Paris. Belin.
Gadet, Françoise. 2006. “Hier comme aujourd’hui. Quelques faits de variation en syntaxe” dans
Guillot, Céline et alii (éds). A la quête du sens. Etudes littéraires, historiques et linguistiques en
hommage à Christiane Marchello-Nizia. Paris. ENS Editions. 191-197.
McEnery, Tony, Xia, Richard & Tono, Yukio. 2006. Corpus-Based Language Studies. An advanced
resource book. New York. Routledge Applied Linguistics.
Rastier, François. 2005. “Enjeux épistémologiques de la linguistique de corpus” dans Williams,
Geoffrey (éd). La linguistique de corpus. Rennes. PUR. 31-45.
Yaguello, Marina. 1998. Petits faits de langue. Paris. Le Seuil.
“Autour du corpus de référence du français parlé”. 2004. Recherches Sur le Français Parlé. 18.
4
Téléchargement