Langue française Grammaire générative et transformationnelle M. Jean Dubois Citer ce document / Cite this document : Dubois Jean. Grammaire générative et transformationnelle. In: Langue française, n°1, 1969. La syntaxe. pp. 49-57; doi : https://doi.org/10.3406/lfr.1969.5397 https://www.persee.fr/doc/lfr_0023-8368_1969_num_1_1_5397 Fichier pdf généré le 04/05/2018 GRAMMAIRE GENERATIVE ET TRANSFORMATIONNELLE 1. Introduction. La linguistique generative, qui intègre certains aspects de la linguistique structurale, s'oppose à elle par les principes de base : il s'agit de rendre compte du fait que. tout sujet parlant peut émettre ou comprendre un nombre indéfini de phrases inédites, alors que les méthodes distributionnelles ne peuvent, dans la meilleure des hypothèses, que rendre compte d'un texte fini (corpus). Mettant l'accent sur des niveaux qualitativement différents et que relie entre eux une combinatoire isomorphe d'un niveau à l'autre, la linguistique distributionnelle avait surtout élaboré un modèle phonologique, minimisant la syntaxe et passant sous silence ou rejetant comme non linguistique l'interprétation sémantique : elle aboutissait à une classification des éléments de langue dont les relations étaient souvent réduites à celles de la partie au tout (phonème /morphème). Démontrant que ce modèle est insuffisant quand il s'agit de rendre compte de la créativité du sujet parlant, N. Chomsky (Syntactic Structures, Mouton, La Haye, 1957) a élaboré une théorie du langage qui puisse mieux correspondre au fonctionnement du langage (V. N. Ruwet, Introduction à la grammaire generative, Pion, 1968). 2. Définition d'une grammaire : Qu'est-ce que faire une grammaire, c'est-à-dire une description complète des règles (phonologiques, syntaxiques, lexicales) d'une langue? C'est construire un modèle capable d'engendrer (d'expliciter) toutes les phrases d'une langue et rien que celles-ci. Autrement dit, il convient qu'une grammaire ainsi faite ne décrive pas seulement les phrases obser49 LANGUE FRANÇAISE № 1 vées dans un corpus, c'est-à-dire un ensemble de données de fait, mais qu'elle soit capable de produire des phrases grammaticalement correctes, quoique non observées, et surtout qu'elle rende compte des jugements de grammaticalité que le sujet parlant une langue porte sur les productions verbales. Ainsi lorsque je rencontre un énoncé comme Le danger redoute les soldats, ma grammaire doit justifier le jugement d'agrammaticalité que, en tant que sujet parlant le français, je porte sur cette phrase. Ma grammaire doit rendre du fait que le verbe aller comme auxiliaire ne peut être utilisé au futur ou au subjonctif; les énoncés * // faut que faille venir. * II ira venir. sont agrammaticaux, au contraire de : // faut qu'il aille chercher un taxi. Il ira chercher un taxi. Plus encore, il faut que ma grammaire rende compte du fait fondamental que la même structure de phrase réalisée peut correspondre, selon la décision du sujet ou la situation, à deux (ou plus de deux) interprétations sémantiques. Par exemple la phrase : Le magistrat juge les enfants coupables est structurellement ambiguë, parce qu'elle peut relever de deux interprétations sémantiques distinctes, soit que le magistrat les juge en tant que coupables, soit qu'il prenne la décision de les condamner. Il y a deux structures syntaxiques sous-jacentes différentes. C'est ainsi que les théoriciens en viennent à distinguer les phrases réalisées et les structures qui les sous-tendent et en fondent la réalisation : ces structures sont dites « de surface » parce qu'elles sont issues elles-mêmes d'une succession de phrases de base, élémentaires, qui constituent la structure profonde et d'une série de transformations. Ainsi dans la phrase que nous avons donnée, les structures de surface sont les suivantes : Le magistrat juge les enfants qui sont coupables. Le magistrat juge que les enfants sont coupables. Elles renvoient à une structure profonde constituée de deux propositions de même forme ([1] les enfants sont coupables; [2] le magistrat juge les enfants/ le magistrat juge ceci). Il peut se faire aussi que les structures de surface renvoient à deux structures profondes, complètement différentes. Ainsi dans Jean aime Jeanne autant que Pierre, la deuxième proposition de base peut être soit Pierre aime Jeanne, soit Jean aime Pierre; c'est là que se situe l'ambiguïté. 50 3. Modèle de compétence et modèle de performance. On distingue essentiellement deux modèles en linguistique : la compétence, proche du concept saussurien de langue, et la performance, proche de la parole. Le premier modèle est constitué de l'ensemble des règles qui permettent d'expliciter les règles de grammaire de la langue et rien que celles-ci. Le second comporte l'ensemble des facteurs comme la mémoire, l'attention, etc., qui définissent le sujet psychologique et les facteurs sociaux ou historiques qui définissent la situation. En quoi ces deux modèles peuvent-ils rendre compte plus facilement du fonctionnement de la langue? C'est que les règles de grammaire qui y sont décrites (le mot règles est ici à prendre non dans son sens normatif , mais dans sa définition mathématique) ont la propriété essentielle d'être récursives. Cela signifie que chaque règle ne connaît aucune limitation théorique dans son application; les limitations effectives que l'on rencontre ne relèvent plus de ce modèle de grammaire (la compétence du sujet parlant), mais de facteurs qui lui sont extérieurs (comme la mémoire, l'attention ou la vigilance, les conditions de la communication, etc.). Ces facteurs divers, qui sont psychologiques, psycho-sociologiques, sociologiques, et dont l'étude relève de disciplines diverses, rendent compte de la production réelle des phrases. Prenons un exemple : si j'introduis (techniquement, si « j'enchâsse ») une proposition relative dans une proposition principale (matrice), en appliquant une transformation à deux phrases élémentaires, j'obtiens : L'homme que tu as rencontré hier était un de mes amis. Supposons que cette opération soit indéfiniment recursive, j'obtiens alors une phrase comme L'homme que tu as rencontré hier à la soirée que donnait M. X..., dont tu connais le fils, que tu avais comme condisciple... était un de mes amis. Or, le nombre des enchâssements possibles est, en fait, variable selon les conditions de la communication, plus grand dans l'énoncé écrit que dans l'énoncé oral. Il est évident que les propriétés syntaxiques sont restées les mêmes; ce qui a changé, ce sont les conditions de la réalisation. Prenons un autre modèle générateur très simple, celui de la multiplication : le calcul mental est, selon les individus, limité à un, deux, trois « chiffres »; mais il suffit de poser les opérations par écrit pour que ces limitations tombent. 4. Les deux parties de la syntaxe : syntagmatique et transformation. La grammaire comporte une partie generative (description syntagmatique) qui est la description syntaxique des phrases de base de la 51 structure profonde et une partie transformationnelle qui permet par une série d'opérations (transformations obligatoires ou facultatives) de passer de la structure de base à des suites terminales, c'est-à-dire à des phrases de la structure de surface auxquelles sont appliquées des règles phonologiques permettant d'aboutir aux phrases effectivement réalisées. Ces transformations, qui sont en nombre fini et mettent en œuvre des opérations en nombre fini (réarrangement; permutation, effacement, addition), permettent de passer des structures de base en nombre fini à l'infini des phrases réellement produites. On appelle indicateur syntagmatique la description syntaxique d'une phrase (représentée par un arbre). Prenons un exemple. La transformation dite généralisée consiste à dériver un indicateur syntagmatique unique (une phrase) de deux indicateurs singuliers (deux phrases de base) par des procédures diverses, celles-ci pouvant être ordonnées différemment. Soit les deux phrases : (1) L'entrepreneur construit cet immeuble. (2) Ceci est ralenti. La première proposition subit une nominalisation qui suit une transformation passive. Elle est ensuite enchâssée dans la phrase matrice (phrase « principale ») : (1) (2) (3) (4) Cet immeuble est construit par l'entrepreneur. Ceci/Que cet immeuble est construit par Г entrepreneur /est ralenti. Ceci/la construction de cet immeuble par Г entrepreneur /est ralenti. La construction de cet immeuble par l'entrepreneur est ralentie. Les opérations sont plus complexes que le résumé pédagogique que nous venons d'en donner en réalisant les symboles ici manipulés; mais on a ainsi une idée de la possibilité d'obtenir un nombre infini de phrases avec un modèle transformationnel. On peut opposer à ces transformations binaires les transformations unaires qui font dériver une seule phrase d'un seul indicateur de base. Il en est ainsi pour le passif. La phrase : Une voiture renverse le passant devient : Le passant est renversé par une voiture. Cette transformation est définie par une succession d'opérations : addition de l'auxiliaire, formation du participe passé, permutation des syntagmes nominaux, addition de la préposition par. 52 Les transformations n'impliquent aucune addition ou modification de sens. Ceci Veut dire en particulier que l'interprétation sémantique des phrases de la structure profonde n'est pas modifiée au cours des transformations généralisées. Une nominalisation ou une relativisation implique sur le plan du discours une hiérarchisation et une articulation logique qui modifie le rapport entre les deux propositions, mais chacune d'entre elles conserve la même interprétation sémantique, une fois la dérivation opérée. En ce qui concerne les transformations singulières (interrogative, emphatique et négative), cette considération a conduit à modifier le premier état de la théorie et à introduire dans les indicateurs syntagmatiques de base les marqueurs « négation », « emphase », « interrogation ». Les transformations sont ordonnées. Il s'agit en effet d'une chaîne longue d'opérations qui permettent de dériver un indicateur syntagmatique de plusieurs phrases nucléaires (ou phrases-noyaux). Soit la proposition : Les achats de légumes par la ménagère. Celle-ci ne peut pas être dérivée directement de : La ménagère achète des légumes. qui, au contraire, est à la source de Les achats de la ménagère en légumes. Il faut passer par la phrase passive (des légumes sont achetés par la ménagère) pour rendre compte de l'apparition de la préposition par. Or, cet ordre des transformations est significatif puisqu'il permet de dissocier ainsi plusieurs types d'opérations qui divergent par l'ordre dans lequel elles sont effectuées et non par leur nature. Les transformations doivent être expliquées; ceci signifie que des règles doivent rendre compte de toutes les opérations effectuées. Il en est une par exemple qui consiste à effacer deux de qui se succèdent. Si le syntagme nominal sujet qui devient complément du nom est précédé de la préposition de, il n'en reste pas moins composé de l'article et du substantif. On a donc : Des légumes sont achetés * Les achats de des légumes. Les opérations consistent alors à effacer un des deux de pour obtenir la suite terminale (Gross, Langages, 7, 1967). 5. L'ambiguïté. L'ambiguïté résulte de ce que la même structure de surface peut être dérivée de deux structures profondes différentes. L'ambiguïté pro53 vient de deux interprétations sémantiques distinctes qui doivent être données au même énoncé pour des raisons syntaxiques. Soit la phrase : La peur des ennemis bouleversa nos plans. Le syntagme nominal sujet résulte de la nominalisation de deux phrases de la structure profonde fondamentalement différentes, puisque l'une comporte pour syntagme sujet les ennemis (ceux-ci ont peur), et l'autre pour syntagme sujet nous (nous avons peur des ennemis). En ce cas, les procédures mises en œuvre par les nominalisations sont telles que les deux suites terminales ont la même forme et reçoivent la même interprétation phonologique. De même une phrase comme : J'achète un livre à mon fils. est susceptible de deux interprétations sémantiques : (1) j'achète un livre pour mon fils (2) j'achète un livre à mon fils (qui est libraire). Certes, le mot fils peut impliquer la préférence pour une solution de l'ambiguïté en faveur de (1), mais ceci dépend de facteurs qui relèvent de la performance et non de la compétence. De plus, rien dans les structures de surface et les indicateurs syntagmatiques dont dérive l'interprétation phonologique ne peut les distinguer. Il faut remonter à la structure profonde pour constater que les deux phrases réalisées sont issues de la transformation de propositions nucléaires distinctes. On peut les apercevoir si on explicite les phrases : j'achète un livre qui sera à mon fils j'achète un livre qui est à mon fils (libraire) la différence est entre : тол fils a un livre mon fils aura un livre. De même : L'enseignement de l'histoire (on enseigne l'histoire /l'histoire enseigne) ou Pierre voyait aussi souvent Jeanne que Paul (Pierre voit Jeanne, Paul voit Jeanne /Pierre voit Jeanne, Pierre voit Paul). Or, la linguistique distributionnelle ne peut rendre compte des ambiguïtés syntaxiques autrement que par le recours à la situation. Encore moins peut-elle définir les divers types d'ambiguïté syntaxique 54 et les relations qu'elles peuvent entretenir entre elles, en raison de la pauvreté du modèle mis en œuvre. 6. Lexique et syntaxe. Lorsque l'on présente les règles syntagmatiques dans la grammaire generative, l'introduction des morphèmes lexicaux se fait sous cette forme : N -» garçon, livre, etc. La première analyse qui a été faite du lexique s'est contentée de considérer qu'il existait des sous-catégorisations du même type que celles qui permettaient de distinguer les deux classes de transitif et d'intransitif parmi les verbes. Aussi a-t-on divisé les noms en animés et non-animés, et on a alors écrit : N N animé N non-animé Mais la difficulté inhérente à ce type de règle est qu'ensuite on se trouve placé devant le problème de diviser les animés en masculins et féminins, en considérant que cette subdivision est hiérarchiquement subordonnée à la première, ce qui est évidemment arbitraire. Cette constatation, ainsi que la forme donnée à la représentation phonologique, ont mis sur la voie d'une seconde solution qui ne consiste pas à représenter le lexique sous la forme d'un arbre taxinomique, mais à considérer que chaque morphème lexical possède une matrice de représentation comportant plusieurs composantes. 1. Une composante phonologique, qui consiste à représenter un morphème lexical par la séquence des traits distinctifs phonologiques. Ainsi ce ne sont plus les phonèmes qui représentent le morphème, mais chacun des phonèmes étant constitué par un faisceau d'oppositions, ce sont ces traits qui sont donnés. Ainsi pour garçon /garso/, la représentation se présentera sous la forme d'une matrice où les traits seront par exemple ceux de l'analyse de Halle-Jakobson (consonantique, compact, etc.). 2. Une composante syntaxique et sémantique qui est représentée pour chaque morphème par une série de rubriques lexicales qui comporte aussi une suite de traits combinés distinctifs. Ainsi un terme comme garçon présentera les traits distinctifs de animé + humain + mâle.. + jeune, etc. Ces rubriques permettent de faire jouer des redondances puisque a humain » implique « animé » et qu'en conséquence dans la représentation ci-dessus on pourra faire l'économie du trait animé. Les traits contenus dans la matrice lexicale seront de deux ordres : a) Traits syntaxiques : ainsi « transitif » pour les verbes. Ce trait 55 contextuel (défini par l'environnement et dépendant du contexte) permet de « sélectionner » un verbe dans un cadre donné. b) Traits sémantiques : ainsi « objet manufacturé /objet non-manufacturé ». Ce dernier trait d'ailleurs peut être réduit à : objet ± humain. Ce trait est dit indépendant du contexte. Ces deux types de traits permettent de rendre compte d'un aspect souvent mal compris de la grammaire generative : les phrases agrammaticales et les phrases anomales. Toute grammaire doit être en effet capable d'engendrer toutes les phrases grammaticales d'une langue et elles seules. Or, si l'on distingue les traits syntaxiques et les traits sémantiques, on fait ainsi la différence entre les degrés de grammaticalité et les degrés d'acceptabilité. Les premiers sont définis aux nœuds de la représentation syntagmatique de la phrase : Si transitif est un trait syntaxique, en ce cas une phrase comme : le garçon dort la soupe est agrammaticale le garçon lit la soupe est anomale. Mais il existe là un problème : certains traits doivent-ils être placés dans la rubrique des traits syntaxiques ou dans les rubriques sémantiques? Si, comme il semble acquis, la distinction animé-humain et non-animé doit être intégrée à la description des traits syntaxiques, alors une phrase comme : le garçon lit la soupe est agrammaticale et non anomale. c) Un autre problème, et très important pour la représentation lexicale, est de savoir si toutes les catégories seront définies par des traits indépendants du contexte. Ainsi pour N. Chomsky les substantifs seront seuls définis par des traits indépendants du contexte (ex. : objet manufacturé ou non), mais les verbes et les adjectifs (parfois chez les linguistes transformationnels assimilés à des verbes) seront définis par des traits contextuels : un verbe sera dit « à sujet animé ». La phrase : Le danger redoute les soldats comporte un verbe qui est « à sujet animé » et la phrase est syntaxique. 7. Les universaux. Le modèle syntaxique ainsi constitué ne peut être celui d'une seule langue; les langues diverses se différencient par les règles d'application, mais les parties generative et transformationnelle doivent reposer sur des 56 universaux. Si ceux-ci ont fait couler beaucoup d'encre et si les souvenirs livresques ont pu en déformer le sens, un exemple permettra de comprendre le problème. Est-il une preuve plus manifeste d'un certain nombre d'universaux linguistiques que le fait que tout texte d'une langue quelconque est traduisible dans une autre langue? On avait jusqu'à maintenant insisté sur le fait, réel, que les traductions ne peuvent être parfaites; et c'est la conséquence de la différence structurelle des règles d'application, mais on n'insistait pas sur ce fait autrement essentiel que n'importe quel texte peut être « traduit », et on ne peut en rendre compte que si l'on pose que toutes les langues ont en commun des règles universelles qui sont loin d'être réduites à l'hypothèse d'une double articulation en « phonèmes » et en « morphèmes » comme le supposait la linguistique structurale; mais il y a, depuis la relation sujet-prédicat jusqu'au réfléchi, un certain nombre de constantes syntaxiques. Or, si l'on suppose que la description linguistique repose ainsi sur des universaux qui caractérisent le langage en tant que propriété de l'homme, on en vient naturellement à poser le problème psychologique de la constitution du modèle de compétence. Celui-ci ressortit alors aux propriétés de l'espèce humaine. Et les études psychologiques sur le langage ont été ainsi profondément transformées par l'apparition de la théorie generative : le modèle de compétence reposant sur des structures inhérentes à l'espèce est très tôt constitué chez l'enfant, non par l'imitation, mais essentiellement à partir d'une prédisposition à recueillir des données sélectionnées. 8. L'intuition du sujet parlant et le linguiste. Et, dernière conséquence qui modifie finalement la personne du linguiste : pouvoir décrire une langue implique, chez celui qui entreprend cette tâche, de la connaître comme sujet parlant; car à tout moment il doit faire appel à l'intuition du sujet qu'il est, non pas seulement pour soutenir sa description, mais pour en rendre compte. Et la théorie generative implique que le linguiste étudie une langue qu'il connaît en tant que sujet; les beaux jours des rapprochements arbitraires entre des langues que l'on ne connaît que de seconde main ou les comparaisons parcellaires et hasardeuses sont du passé. On ne connaît une langue que de l'intérieur et le linguiste comme le mathématicien élabore sa description par une référence constante à une langue qui est la sienne, commune, dans son essence, à la langue de la communauté linguistique dans laquelle il vit. Et l'on voit que la linguistique generative dépasse, comme naguère le structuralisme, le cadre étroit de la discipline linguistique. Jean Dubois Paris 57