13 Chapitre 2: Les fondements de la morphologie Flexion et dérivation Introduction Si l’on postule un niveau d’analyse morphologique dans la description des langues naturelles, c’est parce qu’on fait l’hypothèse que les mots peuvent posséder une structure d’un ordre supérieur à leur simple composition en phonèmes, et que cette structure peut être décrite au moyen d’une unité intermédiaire: le morphème. La hiérarchie segmentale-sémantique se présente donc, à ce stade, de la manière suivante: phonème morphème mot Cependant, pour que cette hypothèse ait quelque plausibilité, il convient d’abord de clarifier la notion intuitive de « mot ». Occurrences, occurrences de mots; lexèmes, occurrences de lexèmes Considérons le paragraphe suivant: Pendant que les guerriers fondent des colonies, les artisans fondent dans le bronze les statues qui représentent les dieux. La Cité se fond en effet dans un ordre supra-naturel qui la fonde. Si je demande à mon traitement de texte combien de « mots » apparaissent dans ce passage, il me répond: 32. Or on peut raisonnablement dire qu’à plusieurs reprises, le même « mot graphique » apparaît deux ou plusieurs fois à la suite d’une répétition: <les…les…les…les>, <fondent…fondent>, <dans…dans>, <La…la> (en négligeant la différence graphique entre majuscule et minuscule), <qui…qui>. Si l’on adopte ce deuxième critère, on dira que le paragraphe en question renferme bien 32 « occurrences » de mots graphiques, mais seulement 25 mots graphiques. Mais par ailleurs, on dira aussi, par exemple dans une analyse grammaticale, que <les> dans <les guerriers>, < les artisans>, < les statues>, <les dieux>, <le> dans <le bronze> et <La> dans < La Cité> sont des « formes » du même « mot », l’article défini; que <fondent> dans <fondent des colonies> et <fonde> sont des « formes » du même mot, le verbe 14 <fonder>; que <fondent> dans < fondent dans le bronze> et <fond> sont des « formes » du même mot, le verbe <fondre>. Ce troisième mode de comptage aboutit au nombre 24. Pour clarifier les choses, il convient d’introduire la notion de « lexème ». Un lexème est une unité plus abstraite que le mot graphique (ou phonologique), et qui est donc susceptible de se manifester à travers plusieurs mots graphiques (ou phonologiques) qui sont ses « formes ». Afin de désigner les lexèmes qui peuvent se manifester à travers plusieurs formes, la grammaire et la lexicologie traditionnelles choisissent l’une de ces formes sur une base systématique: par exemple, pour les lexèmes verbaux, la tradition française choisit la forme infinitive, mais la tradition latine choisit la première personne du singulier de l’infectum de l’indicatif présent (dans le cas où celleci existe); pour les lexèmes nominaux, les traditions française et latine choisissent le masculin (dans le cas où celui-ci existe) et le singulier (dans le cas où celui-ci existe). Désormais, nous adopterons les mêmes conventions, mais en écrivant le nom des lexèmes en majuscules (sans crochets angulaires adjacents, car cette notation nous servira aussi pour l’analyse du langage oral); nous parlerons donc du lexème FAIRE en français, du lexème FACIO en latin, etc. Dans les cas où la forme communément utilisée n’existe pas (voir plus loin), le choix obéit encore à une convention stable. Par exemple, pour les lexèmes verbaux du latin, on emploie alors la première personne du singulier du perfectum de l’indicatif présent (exemple: ODI). Il est important de noter que des suites de lettres (ou de phonèmes) qui comptent comme des occurrences du même mot graphique (ou phonologique) ne comptent pas nécessairement comme des occurrences du même lexème. Par exemple, <fondent> dans <fondent des colonies> et <fondent> dans < fondent dans le bronze> comptent comme deux occurrences du même mot graphique <fondent>, mais non comme deux occurrences du même lexème. Il faut donc travailler avec une classification à quatre termes: Mots graphiques/phonologiques Lexèmes <fondent>, <fond>, <fonde> FONDER, FONDRE Occurrences <fondent>, <fondent>, <fond>, <fonde> FONDER, FONDRE, FONDRE, FONDER Dans les traitements automatiques offerts par des bases de données électroniques (comme FRANTEXT à l’Institut National de la Langue Française), la différence entre ces différents niveaux d’analyse se laisse caractériser au moyen des termes « lemmatisation », « catégorisation » et « analyse ». Si un outil de ce genre n’offre ni lemmatisation, ni catégorisation, ni analyse (comme cela se passe aussi avec les traitements de texte), alors on ne peut y rechercher toutes les 15 occurrences d’un lexème comme FONDRE sans rechercher toutes les occurrences de chacune de ses formes; on obtient alors, en sus, toutes les occurrences de certaines des formes de FONDER et toutes les occurrences de toutes les formes des lexèmes nominaux FOND et FONDS. S’il y lemmatisation, alors on peut rechercher d’un coup toutes les occurrences du lexème FONDRE (qui est un « lemme »), mais on obtient toujours, en sus, toutes les occurrences de certaines des formes de FONDER et toutes les occurrences de toutes les formes des lexèmes nominaux FOND et FONDS. S’il y a catégorisation (par exemple, en tant que « verbe » ou « nom ») des occurrences, alors on peut rechercher d’un coup toutes les occurrences du lexème FONDRE, mais on obtient toujours, en sus, toutes les occurrences de certaines des formes de FONDER. S’il y a analyse, on peut rechercher d’un coup toutes les occurrences du lexème FONDRE, sans obtenir, en sus, toutes les occurrences de certaines des formes de FONDER; mais certains fragments résisteront toujours à une analyse automatique. Flexion et dérivation: caractérisation générale La morphologie traditionnelle repose sur la distinction entre « flexion » et « dérivation ». Cet outil conceptuel fondamental est souvent introduit de manière assez confuse, dans la mesure où la différence entre mot (graphique ou phonologique) et lexème n’est pas suffisamment clarifiée, et où l’on confond souvent l’analyse des relations (ou rapports) morphologiques avec celle des procédés (ou processus) susceptibles de manifester ces relations. Les termes « relation » et « rapport » doivent être entendus ici comme de parfaits synonymes. Par contre, nous aurons à revenir sur le différence entre « procédé » et « processus » (souvent neutralisée dans l’usage courant du mot anglais « process »); pour l’instant, nous n’utiliserons que « procédé ». En première approximation, on peut dire qu’une relation de flexion s’instaure entre mots graphiques ou phonologiques, tandis qu’une relation de dérivation s’instaure entre lexèmes. Autrement dit encore, les termes d’une relation de flexion appartiennent au domaine des « formes », tandis que les termes d’une relation de dérivation appartiennent au lexique. Par exemple, cela a un sens d’établir une relation de flexion entre <chante> et <chanterai>, et une relation de dérivation entre CHANTER et CHANTEUR; mais cela n’a aucun sens d’établir une relation de dérivation entre <chanter> et <chanteur> plutôt qu’entre <chantait> et <chanteuse>, ou une relation de flexion entre CHANTEUR et *CHANTEURS (qui n’est pas un lexème du français). 16 Les relations de flexion et de dérivation se différencient aussi par leurs propriétés logiques. La relation de flexion est une relation d’équivalence (donc une relation réflexive, symétrique et transitive) dans l’ensemble de tous les mots (graphiques ou phonologiques). Comme toute relation d’équivalence est réflexive, il s’ensuit que la relation de flexion est « totale » dans l’ensemble des mots d’une langue: en effet, puisque tout mot entre en relation de flexion avec luimême, il s’ensuit que tout mot entre dans la relation de flexion avec au moins un mot. Par ailleurs, une relation d’équivalence dans un ensemble définit une partition de cet ensemble en classes d’équivalence (c’est-à-dire, techniquement, un ensemble de parties non-vides disjointes deux à deux, dont l’union égale l’ensemble en question); dès lors, la relation de flexion définit une partition de l’ensemble des mots d’une langue en classes d’équivalence. Pour concrétiser les choses, considérons l’ensemble des citoyens belges actuellement en vie. La relation « avoir la même taille que » est une relation d’équivalence dans cet ensemble. En effet, toute personne a la même taille qu’elle-même (réflexivité); si A a la même taille que B, alors B a la même taille que A (symétrie); si B a la même taille que A, et que C a la même taille que B, alors C a la même taille que A (transitivité). Pour autant qu’on se donne un ensemble discret de mesures de tailles (c’est-à-dire qu’on s’arrête par exemple au centimètre en se mettant d’accord sur une procédure d’approximation par « arrondissement » vers le haut ou vers le bas), cette relation définit une partition aisément concevable de manière intuitive. Cette relation est aussi totale, car même si j’ai une taille de 3,20m, il existe une classe d’équivalence dont je suis le seul élément; aucun citoyen belge actuellement en vie ne saurait donc tomber « en dehors » de la partition en cause. La relation de dérivation est une relation d’ordre irréflexive, asymétrique et intransitive dans l’ensemble des lexèmes d’une langue. C’est aussi une relation qui peut être « partielle » (et qui, dans les faits, est toujours partielle) en ce sens qu’il est possible (et, dans les faits, toujours vérifié) que certains lexèmes n’entrent en relation de dérivation avec aucun lexème (ce qui exige l’irréflexivité). Pour concrétiser les choses, considérons de nouveau l’ensemble des citoyens belges actuellement en vie. La relation « avoir la taille immédiatement inférieure à celle de » est une relation d’ordre irréflexive, asymétrique et intransitive dans cet ensemble. En effet, personne n’a la taille immédiatement inférieure à la sienne propre (irréflexivité); si A a la taille immédiatement inférieure à celle de B, alors B n’a pas la taille immédiatement inférieure à celle de A (asymétrie); si B a la taille immédiatement inférieure à celle de A, et C a la taille immédiatement inférieure à celle de B, alors C n’a pas la taille immédiatement inférieure à celle de A (intransitivité). Cette relation peut être partielle, car si aucun citoyen belge ne mesure 1,21m et qu’aucun citoyen belge ne mesure 1,23m, alors celui qui se trouverait mesurer 1,22 ne saurait constituer l’un des termes de la relation « avoir la taille immédiatement inférieure à celle de ». Propriétés empiriques de la flexion La théorie morphologique se donne comme contrainte empirique que chacune des classes d’équivalence définies par la relation de flexion doit se voir correspondre un et un seul lexème. Comme nous le verrons bientôt, l’inverse n’est pas vrai: certains lexèmes se voient correspondre plus d’une classe flexionnelle. Ceci impose que les mots graphiques ou phonologiques qui peuvent réaliser des lexèmes différents soient expressément distingués (« désambiguïsés »): on devra donc distinguer 17 <fondent 1>, forme de FONDER, de <fondent 2>, forme de FONDRE, etc. En effet, si ce n’était pas le cas, <fondent> entrerait en relation de flexion à la fois avec <fondera> et avec <fondra>; et comme la relation est symétrique et transitive, on aboutirait à ce que <fondera> entre en relation de flexion avec <fondra>, ce qui entraînerait l’impossibilité d’encore distinguer les lexèmes FONDER et FONDRE. Si <fondent> est en relation de flexion à la fois avec <fondera> et <fondra>, alors (par symétrie) <fondera> est en relation de flexion avec <fondent>; et comme <fondent> est en relation de flexion avec <fondra>, il s’ensuit (par transitivité) que <fondera> est en relation de flexion avec <fondra>. Dès lors, les lexèmes FONDER et FONDRE ne sont plus distingués. Si un lexème a au moins deux formes distinctes appartenant à la même classe flexionnelle, il doit être possible de décrire chacune d’entre elles comme la combinaison de ce lexème avec les « valeurs » d’une série de « catégories morphologiques » comme le Genre, le Nombre, le Cas, la Conjugaison, l’Aspect, le Mode, le Temps, la Personne, etc. Par exemple, la forme <fondera> sera décrite comme la combinaison du lexème FONDER avec la valeur [première] de la catégorie de la Conjugaison, la valeur [indicatif] de la catégorie du Mode, la valeur [futurpr] de la catégorie du Temps, la valeur [3] de la catégorie de la Personne, et la valeur [singulier] de la catégorie du Nombre. On exige, bien évidemment, qu’à chaque catégorie correspondent au moins deux valeurs; sinon, la notion même de catégorie morphologique perdrait tout intérêt descriptif. Dans la morphologie traditionnelle, l’inventaire des catégories morphologiques, et des valeurs correspondant à chacune d’elles, sert à définir ce qu’on appelle la « déclinaison » (caractéristique des lexèmes nominaux au sens large du terme — adjectifs, pronoms et déterminants compris) et la « conjugaison » (caractéristique des lexèmes verbaux). Autrement dit, cette dichotomie morphologique correspond à la dichotomie syntaxique fondamentale entre nom et verbe. Depuis toujours, cette analyse s’est heurtée à l’existence de formes « hybrides » comme le « participe » (qui tire son nom, justement, de ce qu’il « participe » du nom et du verbe). Comme nous venons de le faire, nous noterons dorénavant les noms des catégories morphologiques avec une majuscule initiale, et les noms des valeurs morphologiques en caractères ordinaires flanqués de crochets droits. Les lexèmes qui possèdent une flexion sont dits « variables ». Certains lexèmes (comme les prépositions françaises, par exemple) sont donc dits « invariables », en ce sens qu’ils ne se combinent avec aucune valeur morphologique. On peut ainsi décrire n’importe quel mot comme la combinaison d’un lexème avec n valeurs morphologiques — n étant égal à 0 pour les lexèmes invariables, et plus grand ou égal à 1 pour les lexèmes variables. La combinaison des lexèmes avec les valeurs morphologiques est une opération commutative, que nous noterons au moyen du signe « & ». 18 L’addition de l’arithmétique élémentaire est commutative, car 3+6 = 6+3 = 9. De même, FONDER & [première] & [indicatif] & [futurpr] & [3] & [singulier] n’est pas différent de: [première] & FONDER & [3] & [singulier] & [indicatif] & [futurpr] Cette opération obéit à la contrainte générale qu’aucun mot n’est définissable par la combinaison d’un certain lexème avec deux valeurs de la même catégorie morphologique. Par exemple, la combinaison FONDER & [première] & [indicatif] & [futurpr] & [3] & [2] & [singulier] ne définit aucun mot. Il convient de remarquer qu’il ne saurait être question de réclamer qu’à chaque lexème corresponde une et une seule classe d’équivalence de mots (graphiques ou phonologiques) en termes flexionnels. Soit, par exemple, le lexème prépositionnel français APRÈS, que l’on peut prononcer /apr /, par exemple dans <après les fêtes>, ou /apr z/, par exemple dans <après avoir choisi>. La théorie morphologique exclut qu’une relation de flexion s’instaure entre /apr / et /apr z/, puisque APRÈS est un lexème invariable. Celui-ci se voit donc correspondre deux classes d’équivalence flexionnelles, à savoir {/apr /} et {/apr z/}. Par ailleurs, il est possible que la combinaison d’un certain lexème avec les valeurs morphologiques requises définisse deux ou plusieurs mots. Par exemple, la combinaison du lexème FONDER avec les valeurs [première], [indicatif], [futurpr], [3] et [singulier] définit les mots phonologiques suivants, qui appartiennent tous à la même classe flexionnelle: /f dra1/ /f dŒra/ dans <fondera des villes> /f drat1/ /f dŒrat/ dans <fondera-t-elle> Le choix entre /apr / et /apr z/, ou entre /f dra1/, /f dŒra/, /f drat1/ ou /f dŒrat/, n’est pas déterminé par la morphologie, mais bien par les règles qui président à la formation des groupes prosodiques correspondant aux groupes clitiques ou aux syntagmes; nous y reviendrons dans la partie syntaxique du cours. Par ailleurs, la flexion se caractérise par deux autres propriétés empiriques, à savoir la complétude et l’absence de filtrage sémantique. La complétude La propriété de complétude peut être définie comme le fait qu’en principe, un lexème peut prendre toutes les valeurs de toutes les catégories morphologiques avec lesquelles il est combinable. Considérons, par exemple, un lexème verbal récemment entré en français comme FORWARDER: tout locuteur s’est initialement familiarisé avec ce lexème à travers une forme déterminée; il n’empêche que toute la conjugaison de ce verbe (<forwarde>, <forwardait>, <forwarderai>, <forwardé>, etc.) est accessible à n’importe quel locuteur. Cette caractéristique 19 de la flexion contribue à assurer ce que nous avons appelé la « détachabilité » de l’information. En effet, si tel n’était pas le cas, je ne pourrais dire « Pierre me forwardera le message demain » pour rapporter l’information que Pierre m’a transmise en disant « Je te forwarderai le message après-demain ». La complétude connaît cependant certaines limitations. Toutes les grammaires enregistrent, par exemple, l’existence de ce qu’on appelle des « verbes défectifs », à flexion incomplète: par exemple, le lexème verbal latin ODI ne se combine qu’avec la valeur [perfectum] de la catégorie de l’Aspect. Mais en général, l’inventaire de ces verbes est gonflé, dans la mesure où l’on ne tient pas suffisamment compte de facteurs syntaxico-sémantiques ou phonologiques. Prenons le cas des lexèmes FALLOIR et PLEUVOIR. Le fait qu’on ne trouve ni <*nous fallons>, ni <???nous pleuvons> ne relève pas de la morphologie, car des constructions telles que <*nous allons falloir> ou <???nous voulons pleuvoir> sont tout aussi inacceptables, alors que la forme <falloir> ou <pleuvoir> n’est en rien problématique, comme le montrent des exemples comme <Il va falloir jouer serré> ou <Il va pleuvoir>. On notera que si <???nous pleuvons> est un peu moins mauvais que <*nous fallons>, c’est pour la même raison qui fait que <???nous voulons pleuvoir> est un peu moins mauvais que <*nous allons falloir>: en effet, on pourrait imaginer que, dans un récit poétique, des gouttes de pluie disent, de leur charmante voix cristalline, <???nous pleuvons> ou <???nous voulons pleuvoir>. De même, le verbe FRIRE est considéré comme défectif car on ne trouve pas de formes telles que <*frions>, <*friais>, <???frira>, etc. (les jugements d’acceptabilité sont ceux de l’auteur de ces lignes). Mais on observe que des formes non problématiques comme <frire> ou <frit> connaissent de sérieuses limitations d’emploi: dans le français de l’auteur de ces lignes, la phrase <??On doit frire ce poisson> est difficile, comparée à <On doit faire frire ce poisson>; de même, <??Maman a frit les pommes de terre> est difficile, comparée à <Maman a fait frire les pommes de terre>. Du côté de la phonologie, c’est souvent l’incertitude quant à la forme à employer qui génère la défectivité. Par exemple, la forme <courrais>, banale à l’écrit, pose de sérieux problèmes à l’oral car elle exige une gémination du /r/ ce qui exceptionnel en français (seules les formes correspondantes de MOURIR présentent la même caractéristique). Certains sujets produisent /kurir / ou /kurŒr /, qui sont des formes réputées incorrectes; on assiste alors à une stratégie d’évitement, qui consiste tout simplement à ne pas utiliser ce futur du passé dans le discours oral spontané. De même, pour le futur du présent de BOUILLIR, troisième personne du singulier, de nombreux locuteurs hésitent entre /bujira/, /bura/, /buŒra/ et /bu:ra/ avec un /u:/ long; de nouveau, la solution consiste 20 à éviter ce genre de formes. À côté de ces phénomènes à causalité syntaxico-sémantique ou phonologique, il existe des cas plus troublants, comme celui du verbe RENAÎTRE qui pose des problèmes au passé simple (<??À cette époque, le Romantisme renaquit>) et au participe passé (<???À cette époque, le Romantisme est rené>), alors que des phrases telles que <À cette époque, le Romantisme commença à renaître> ou <À cette époque, le Romantisme a commencé à renaître> ne posent aucun problème. Les causes de telles anomalies restent mal comprises. La complétude connaît une autre limitation due au fait que, dans certaines langues, certaines catégories de lexèmes tendent à contraindre lexicalement les valeurs de certaines catégories morphologiques. C’est le cas, en latin et dans les langues romanes, pour la quasitotalité des lexèmes verbaux, qui contraignent la valeur prise par la catégorie Conjugaison, et pour la très grande majorité des lexèmes substantivaux, qui ont ce qu’on appelle un Genre « grammatical » ou « intrinsèque ». Par exemple, en français, le lexème TABLEAU n’a pas de féminin, et le lexème TABLE n’a pas de masculin; ceci n’est pas vrai de tous les lexèmes substantivaux, témoins CHIEN ou CHANTEUR, mais il faut alors que la variation en Genre soit corrélée à une variation sémantique de sexe. Du point de vue technique, si un lexème L ne se combine qu’avec une valeur déterminée [v] d’une catégorie morphologique C, alors le lexique ne contient pas L tout court, mais bien la combinaison L & [v]. Par exemple, le lexique latin ne contient pas ODI tout court, mais bien la combinaison ODI & [perfectum]. De même, le lexique français ne contient pas CHANTER tout court, mais bien la combinaison CHANTER & [première]; il ne contient pas TABLEAU tout court, mais la combinaison TABLEAU & [masculin]; par contre, il contient CHIEN tout court. Les adjectifs se distinguent des substantifs par le fait qu’ils ne possèdent pas de Genre intrinsèque. La raison en est, bien entendu, qu’il existe un mécanisme syntaxique qui déclenche l’accord en Genre de l’adjectif vis-à-vis du substantif dans toute une série de constructions. Si certains adjectifs, comme GRAND par exemple, avaient un Genre intrinsèque (par exemple le masculin), on pourrait les utiliser pour attribuer la propriété de grandeur à un tableau, mais pas à une table; la puissance d’expression du système linguistique s’en trouverait très sérieusement compromise. Deux remarques à ce propos. Un lexème adjectival comme MARRON possède bel et bien un féminin, même si les formes féminines ne se distinguent pas des formes masculines; sinon, on ne pourrait dire <une robe marron>, <des robes marron>. D’autre part, un adjectif comme ENCEINTE ne possède pas un Genre intrinsèque, et n’est donc en aucune manière « défectif ». L’impossibilité (relative) de <?Un garçon enceinte> ou celle, plus nette, de <???Un garçon enceint> a une source sémantique évidente. On notera que, si j’ai une jeune copine qui porte des cheveux courts, conduit une moto, raconte des blagues cochonnes, tape dans le dos de ses amis routiers,… mais se trouve néanmoins porter un enfant, il devient possible de la décrire comme <?Un garçon enceinte>; l’hybridité de la construction reflétant bien l’hybridité du personnage. 21 L’absence de filtrage sémantique Cette propriété peut se caractériser négativement par le biais d’une expérience de pensée. Soit le verbe BATTRE et les phrases <Elle bat son mari>, <Le paysan bat le blé>, <Pierre bat la campagne>, <Le Brésil bat l’Argentine>, etc. Supposons que, conjugué à l’imparfait, ce lexème ne puisse plus avoir d’autre signification que celle qu’on trouve dans la phrase <Elle bat son mari> (pour désigner un certain type d’action exercé par un individu humain sur un autre individu humain). On pourrait alors dire <Elle battait son mari>, mais non <*Le paysan battait le blé>, <*Pierre battait la campagne>, <*Le Brésil battait l’Argentine>, etc. De nouveau, la puissance d’expression du système linguistique serait gravement compromise, car de nombreuses informations cesseraient d’être « détachables ». L’absence de filtrage sémantique consiste donc dans le fait qu’un lexème conserve l’ensemble de ses potentialités sémantiques à travers toute sa flexion, c’est-à-dire quel que soit le mot qui le réalise. Les seules différences sémantiques qui séparent nécessairement <bat> de <battait> doivent être dues aux valeurs respectives que prennent les diverses catégories morphologiques impliquées. Cette propriété empirique a des conséquences assez remarquables. Ainsi, des lexèmes apparentés comme BATTEUR et BATTEUSE, qui dérivent tous les deux de BATTRE (nous le verrons plus bas), peuvent présenter une alternance formelle analogue à celle que l’on trouve entre <chanteur(s)> et <chanteuse(s)>. Mais si <chanteur(s)> est le masculin de CHANTEUR, et <chanteuse(s)> le féminin de CHANTEUR, rien ne nous autorise à dire que <batteur(s)> est le masculin de BATTEUR et <batteuse(s)> le féminin de BATTEUR. En effet, les potentialités sémantiques de BATTEUR (donc de <batteur(s)) et celles de BATTEUSE (donc de batteuse(s)) diffèrent du tout au tout: dans un cas, il s’agit d’un(e) instrumentiste (ou d’un type de joueur dans un certain sport américain qui reste parfaitement opaque à l’auteur de ces lignes), dans l’autre d’un engin agricole ou d’un ustensile de cuisine. Il faut donc considérer que tant BATTEUR que BATTEUSE ont un genre « intrinsèque » ou « grammatical ». Il en va de même, en espagnol, pour des paires de lexèmes comme CESTO-CESTA, CUBO-CUBA, CHARCO-CHARCA, HUERTO-HUERTA, etc. où la différence sémantique s’établit en référence à la taille des entités désignées (une entité désignable par le lexème féminin, par exemple HUERTA « culture maraîchère », étant en principe plus grande que l’entité désignable par le lexème masculin, par exemple HUERTO « verger »). 22 Propriétés empiriques de la dérivation Comme nous l’avons dit plus haut, la dérivation est une relation d’ordre irréflexive, asymétrique, intransitive et partielle dans l’ensemble des lexèmes d’une langue. Nous la représenterons schématiquement de la manière suivante: Lexème de base (ex. CHANTER) Lexème dérivé (ex. CHANTEUR) {<chanter>, <chantais>, <chanterons>, etc.} {<chanteur>, <chanteuse>, <chanteurs>, <chanteuses>} On voit que, dans ce genre de cas, la relation entre les deux lexèmes peut évidemment se concevoir comme une relation entre deux classes d’équivalence flexionnelles; mais, comme nous l’avons dit, rien n’autorise à établir une relation de dérivation entre <chanter> et <chanteur> plutôt qu’entre <chantais> et <chanteuse>, par exemple. Il faut également insister sur le fait qu’un lexème n’est dit « de base » que par rapport à un certain lexème qui en est « dérivé » et vice-versa. Il existe, certes, des lexèmes qui ne sont les dérivés d’aucun autre lexème (c’est notamment le cas pour ceux qui n’entrent dans aucune relation de dérivation, par exemple ARAUCARIA), mais rien n’empêche un lexème d’être à la fois « de base » (par rapport à un certain autre lexème) et « dérivé » (par rapport à un lexème évidemment distinct du précédent). C’est ce que l’on observe, par exemple, pour SOLUBLE, dérivé de RÉSOUDRE et lexème de base par rapport à INSOLUBLE: RÉSOUDRE SOLUBLE INSOLUBLE Pour distinguer empiriquement la flexion de la dérivation, on a utilisé un certain nombre de critères qui ne se révèlent pas tous également satisfaisants. Le premier critère est catégoriel. Si deux mots rentrent dans une relation de flexion, ils appartiennent nécessairement à la même catégorie grammaticale (dans la mesure où l’on a toujours essayé de rattacher les types de flexion — par exemple la déclinaison et la conjugaison — aux catégories syntaxiques les plus fondamentales). Par contre, si deux lexèmes entrent dans une relation de dérivation, ils peuvent — mais ne doivent pas — appartenir à des catégories grammaticales distinctes; par exemple, on a: RÉSOUDRE SOLUBLE à côté de: FAIRE DÉFAIRE Ce critère est faible pour deux raisons. D’abord, il y a un risque de circularité entre la catégorisation syntaxique et l’analyse morphologique. Ensuite, un rapport morphologique qui préserve la catégorisation syntaxique peut toujours relever, a priori, de la flexion ou de la 23 dérivation. Le cas des adverbes latins ou français illustre bien cette difficulté, et la manière dont on peut la surmonter. Soit une forme adverbiale clairement apparentée à une forme adjectivale, par exemple en latin / /, apparenté à / /, / /, etc. ou en français, <parfaitement> apparenté à <parfait>, <parfaite>, etc. Si l’on regroupe la forme adverbiale et les formes adjectivales sous la même entrée lexicographique, comme on le fait souvent en latin, cela implique qu’une relation de flexion s’instaure entre elles; mais si tel est le cas, alors on ne peut plus maintenir que l’adjectif et l’adverbe sont deux catégories syntaxiques distinctes. résoudre le problème, on fait généralement observer qu’il existe des adverbes, comme / Pour / en latin ou <bigrement> en français, qui ne sauraient entrer en relation de flexion avec une forme adjectivale; en effet, / / est dérivé du lexème prépositionnel-adverbial CIRCA et <bigrement> est dérivé de l’interjection BIGRE. Par conséquent, il est préférable de conserver la catégorie syntaxique de l’adverbe, en admettant que le lexème de base puisse être, entre autres choses, de catégorie adjectivale. L’exemple des adverbes nous conduit à un autre critère, d’application très délicate malheureusement, qui a à voir avec ce que l’on pourrait appeler la « productivité ». En gros, il consiste à montrer qu’il est fréquent de trouver des lexèmes dérivés dont les formes présentent des similitudes formelles, mais sans qu’on puisse retourner, à partir de chacun d’entre eux, vers un lexème de base appartement toujours à la même catégorie. Ainsi, / / et / / se ressemblent formellement, mais il n’est pas possible de retourner dans les deux cas (pour FELICITER comme pour CIRCITER) à une base adjectivale; <parfaitement> et <bigrement> se ressemblent, mais il n’est pas possible de retourner dans les deux cas (pour PARFAITEMENT comme pour BIGREMENT) à une base adjectivale. On retrouve le même phénomène dans la série suivante: FAIRE DÉFAIRE ZIPPER DÉZIPPER DÉROUTER DÉBALLONNER En effet, DÉROUTER n’est pas un dérivé d’un lexème *ROUTER (que l’auteur de ces lignes ne possède pas dans son lexique) mais plutôt de ROUTE; et DÉBALLONNER ne semble pas lié à BALLONNER, mais plutôt à l’adjectif GONFLÉ (au sens de « audacieux, agressif, etc. ») qui connaîtrait dès lors deux dérivés très proches, à emploi pronominal: DÉGONFLER (dans le sens de « perdre toute son audace ») et DÉBALLONNER. 24 En revanche, la propriété d’incomplétude et la présence d’un filtrage sémantique semblent mieux caractériser la dérivation par rapport à la flexion. L’incomplétude De manière générale, l’existence d’un nombre, même important, de couples lexème de base de catégorie Ci - lexème dérivé de catégorie Cj (avec i égal à, ou différent de, j), même accompagnée d’une très grande similitude des formes impliquées, ne suffit pas à garantir qu’à un lexème donné, qui pourrait alors fournir une base, corresponde un lexème dérivé existant. Par exemple, à partir des paires: CHANTER CHANTEUR SOUDER SOUDEUR TRIPOTER TRIPOTEUR DRAGUER DRAGUEUR NAGER NAGEUR DESCENDRE DESCENDEUR etc. peut-on poser, aussi banalement: BOMBARDER ??BOMBARDEUR EXPLIQUER ??EXPLIQUEUR SIGNALER ??SIGNALEUR etc. La réponse est évidemment négative. Certains rejettent cet argument dans les termes suivants. Si je dis du maréchal Goering, dont le goût pour les bombardements massifs est bien connu, que c’était un <bombardeur>, tout le monde me comprendra; de même, si je dis d’un enseignant qui s’attarde volontiers (comme le fait Bibi pour le moment) dans de longues explications, que c’est un <expliqueur>, tout le monde me comprendra aussi. Mais le problème n’est pas là. Si quelqu’un me dit <je te forwarderai le message demain>, alors que je n’ai jamais entendu la forme <forwarderai> précédemment, je n’ai pas l’impression qu’il a accompli une création lexicale; et s’il s’agit d’un étudiant non-natif, je n’éprouverai pas la tentation de lui dire de ne pas utiliser cette forme alors que j’accepterais qu’il dise <forwarde> ou <forwardais>. Par contre, si j’entends produire <bombardeur> dans la situation décrite, je pourrai y voir une création adroite, sarcastique, etc. si cela vient de la bouche 25 d’un chroniqueur du Monde, mais déconseiller fortement un tel usage à un étudiant non-natif, en lui disant que « ce mot n’existe pas ». L’incomplétude se laisse donc caractériser de la manière suivante: toute exploitation nouvelle d’une régularité de dérivation dans le chef d’un locuteur est une création lexicale de sa part; et l’acceptation de cette activité créatrice dépend, pour une part, du statut de ce locuteur, de la situation d’échange où l’on se trouve, etc. Le filtrage sémantique Dans la dérivation, le filtrage sémantique se manifeste par le fait que les potentialités sémantiques du lexème dérivé ne recouvrent qu’une partie, parfois infime, des potentialités sémantiques du lexème de base. Par exemple, le lexème BATTEUR (si l’on néglige l’usage qu’on en fait pour parler du base-ball, usage que l’auteur de ces lignes ne maîtrise pas) ne retient, du lexème de base BATTRE, que les potentialités sémantiques présentes dans des expressions telles que <battre le rythme>. On observe aussi que des dérivés d’une même base se différencient presque toujours à cet égard. Ainsi BLANCHIMENT et BLANCHISSAGE dérivent tous deux de BLANCHIR, mais si on peut <blanchir de l’argent> et <blanchir du linge>, on ne peut parler d’un <*blanchissage d’argent sale> ou d’un <???commerce de repassage et blanchiment de lingerie délicate>. De même encore, RAFFINEMENT et RAFFINAGE dérivent de RAFFINER, mais si on peut <raffiner du pétrole> et <raffiner sans cesse davantage l’analyse du sonnet italien>, on ne peut parler du <*raffinement du pétrole> ou d’un <*raffinage excessif dans l’analyse du sonnet italien>. Même les régularités de dérivation les plus massives n’échappent pas à ce phénomène; ainsi DÉPEUPLER vis-à-vis de PEUPLER: à côté de <Les souvenirs de l’Espagne peuplent mes souvenirs>, on ne saurait trouver <*Mon angoisse dépeuple mes souvenirs>. Si l’ensemble des potentialités sémantiques du dérivé doit être inclus (et est, dans les faits, strictement inclus) dans l’ensemble des potentialités sémantiques de la base, il s’ensuit que lorsqu’un dérivé se trouve posséder une potentialité sémantique étrangère (ou devenue étrangère) à la base, alors un lexème indépendant de celle-ci existe (ou émerge) dans le lexique. C’est le cas, par exemple, de IMPERTINENT, qui était auparavant un dérivé de PERTINENT, rôle dans lequel il a été remplacé par NON-PERTINENT. Certains locuteurs acceptent encore <Cet argument est impertinent>, au sens de « Cet argument n’est pas pertinent ». Pour décrire leur usage, il faut distinguer deux lexèmes IMPERTINENT1 et IMPERTINENT2 dont l’un seulement est un dérivé de PERTINENT (et se trouve dès lors en concurrence avec NONPERTINENT). On notera la source de ce phénomène: l’une des manières de se montrer impertinent ou impoli dans la conversation est de se montrer non-pertinent. 26 Il convient de noter, à cet égard, que le filtrage sémantique permet de montrer en quoi l’ordre postulé entre une base et son dérivé permet de maintenir une économie considérable dans la description du lexique, en autorisant une importante dose de « polysémie ». Prenons de nouveau à titre d’exemple le verbe BATTRE et certains de ses dérivés: BATTRE BATTEUR BATTRE BATTEUSE BATTRE BATTANT BATTRE BATTAGE BATTRE BATTEMENT etc. Si l’on posait un ordre de dérivation inverse, soit: *(BATTEUR BATTRE) BATTEUSE BATTRE) *(BATTANT BATTRE) *(BATTAGE BATTRE) *(BATTEMENT BATTRE) etc. on aboutirait à un résultat inacceptable, car le dérivé (BATTRE) aurait chaque fois des potentialités sémantiques étrangères à celles de la base. Il faudrait donc multiplier les lexèmes BATTRE1, BATTRE2, BATTRE3, etc., ce qui aboutirait à remplacer une « polysémie » massive par une énorme quantité d’homonymies. Quelques précisions et quelques interrogations au sujet de la dérivation Le fait de postuler une relation de dérivation entre un lexème de base et un lexème dérivé ne signifie ni que la base soit diachroniquement plus ancienne que le dérivé, ni qu’elle connaisse un usage plus normal ou plus fréquent que celui-ci. Pour illustrer le premier point, considérons le lexème FLAMMABLE « inflammable » en anglais des États-Unis. On sait que, dans cet emploi, la forme <flammable> est issue d’une analyse, étymologiquement erronée, de la forme <inflammable> comme signifiant non pas « inflammable » mais « non susceptible de prendre feu ». En d’autres termes, chez les locuteurs qui ont créé ce lexème, INFLAMMABLE était un dérivé de FLAMMABLE, comme 27 IMPOSSIBLE l’est de POSSIBLE; mais cela n’empêche que FLAMMABLE est apparu après INFLAMMABLE. Pour illustrer le second point, considérons la série suivante: BATTRE ?BATTABLE IMBATTABLE FROISSER FROISSABLE INFROISSABLE DÉCRIRE DESCRIPTIBLE INDESCRIPTIBLE ÉCOUTER ??ÉCOUTABLE ?INÉCOUTABLE etc. Dans cette série, le dérivé à signification négative est, dans des proportions très variables selon les cas, d’un usage plus normal et plus fréquent que la base dont il dérive. Un lexème comme ?BATTABLE ou ??ÉCOUTABLE, dans la mesure où il existe, ne s’emploie pratiquement que dans des phrases du genre <Ce jour-là, l’Argentine (n’)était (pas) battable>, <??Pour une fois, la blague que Pierre a racontée était écoutable>, etc. Cette observation nous conduit à aborder un problème extrêmement délicat. Soit les lexèmes VAINCRE et INVINCIBLE. Si on les compare à la série précédemment discutée, on constate un problème, à savoir que le lexème de base dont INVINCIBLE devrait dériver n’existe apparemment pas. A priori, trois solutions peuvent être offertes. La première, qui est celle des grammaires traditionnelles, consiste à supposer qu’il existe, dans les systèmes morphologiques, des dérivations « parasynthétiques » qui sautent tout simplement une étape, en faisant dériver un lexème L3 d’un lexème L1 là où, d’habitude, un lexème analogue à L3 (appelons-le L3’) dérive d’un lexème L2’ qui dérive lui-même d’un lexème L1’ analogue à L1. Par exemple, la dérivation « parasynthétique » de INVINCIBLE à partir de VAINCRE se présentera comme suit: VAINCRE (L1) BATTRE (L1’) INVINCIBLE (L3) BATTABLE (L2’) IMBATTABLE (L3’) Une deuxième solution consiste à supposer un lexème L2 (appelons-le « VINCIBLEØ ») présentant la particularité de posséder une « flexion vide », c’est-à-dire de ne pouvoir être manifesté par aucun mot: VAINCRE (L1) VINCIBLEØ (L2) INVINCIBLE (L3) La troisième solution consiste à supposer que BATTABLE, par exemple, est le dérivé à la fois de BATTRE et de VAINCRE, et est la base à la fois de IMBATTABLE et de INVINCIBLE: VAINCRE (L1) BATTABLE (L2) INVINCIBLE (L3) BATTRE (L1’) BATTABLE (L2) IMBATTABLE (L3’) 28 Aucune de ces solutions n’est satisfaisante. La première se borne à reformuler le problème. La deuxième aboutit à ce que la notion de « lexème » tend à se confondre avec la notion (mentale) de « concept ». La troisième est empiriquement inadéquate, en ce sens que INVINCIBLE a des potentialités sémantiques étrangères à celles de BATTABLE: si on peut parler d’une <bonne humeur invincible>, on ne saurait dire que <*Ce jour-là, la bonne humeur de Paul n’était pas battable>. Autres mécanismes de création de lexèmes Il existe, dans les systèmes linguistiques, des mécanismes de création de lexèmes qui ne relèvent pas de la dérivation au sens étroit où nous l’avons définie ici. Parmi ces mécanismes, il convient d’abord de décrire les créations « à parenté multiple », où le lexème est créé à partir de deux ou plusieurs lexèmes. On distingue, dans cette classe: • la composition: TOURNEVIS à partir de TOURNER et VIS, TIRE-BOUCHONS à partir de TIRER et BOUCHON, MAÎTRE-CHIENS à partir de MAÎTRE et CHIEN, AMÉRICANO-CHINOIS à partir de AMÉRICAIN et CHINOIS, FRIGOTARTINABLE à partir de FRIGO et TARTINABLE, etc. • les « mots-valises », très courants en anglais: BRUNCH à partir de BREAKFAST et LUNCH, LINGLISH à partir de LINGUIST et ENGLISH, FRANGLAIS à partir de FRANÇAIS et ANGLAIS, FOULTITUDE à partir de FOULE et MULTITUDE, BOURREAUCRATE à partir de BOURREAU et BUREAUCRATE, etc. • des cas comme ISME ou ALGIE: ISME à partir de SOCIALISME, LIBÉRALISME, COMMUNISME, etc. (quand on dit <Il faut libérer de tous les ismes>); ALGIE, à partir de NÉVRALGIE, LOMBALGIE, SCIATALGIE, etc. (quand on dit <Notre époque se caractérise par une attention plus forte portée aux algies>). On trouve ensuite des cas où le lexème est créé à partir d’une expression syntaxique, c’està-dire d’une combinaison libre de lexèmes: TROP-PLEIN, TROP-PERÇU. Parfois l’existence d’un tel lexème n’est établie que par le biais de la dérivation, au sens classique du terme. Par exemple, l’existence du lexème PREMIER MINISTRE est établie par l’existence du dérivé PREMIER MINISTRABLE (noter que la suite <premier ministrable> est ambiguë: soit elle réalise le lexème PREMIER MINISTRABLE, par exemple dans <Di Rupo fait de plus en plus figure de premier ministrable>; soit elle réalise la combinaison des lexèmes PREMIER et MINISTRABLE, par exemple dans <Le premier ministrable de cette liste est Di Rupo; le second, 29 c’est Reynders>). De même, l’existence du lexème QUART DE FINALE est établie par l’existence du dérivé QUART DE FINALISTE. On trouve également des lexèmes obtenus à partir d’une expression susceptible de constituer une phrase complète: M’AS-TU VU (<Pierre est un m’as-tu vu>); DÉCROCHEZMOI ÇA (<Elle a acheté cette robe au décrochez-moi ça>); JE M’EN FOUTISME à partir de JE M’EN FOUS; À QUOI BONISME à partir de À QUOI BON; JUSQU’AU BOUTISME à partir de JUSQU’AU BOUT. On considère généralement qu’il existe un lien entre l’usage typique de l’expression phrastique considérée et les potentialités sémantiques du lexème créé: un <décrochez-moi ça> est un commerce de vêtements où on dit typiquement <Décrochez-moi ça!>, le <je m’en foutisme> est l’attitude de ceux qui disent typiquement <Je m’en fous>, etc. De ce point de vue, ce type de création ressemble à ce qui se passe pour des lexèmes comme QUIRITO en latin, PORDIOSEAR en espagnol, ou BIGREMENT, déjà cité, en français. QUIRITO signifie « appeler à l’aide » en criant typiquement <Quirites!> « Romains! »; PORDIOSEAR signifier « mendier » en disant typiquement <¡Por Dios!>; BIGREMENT se dit pour parler de situations où l’on dirait typiquement <Bigre!>. Ce mécanisme a été baptisé « délocutivité » ou « dérivation délocutive », mais il ne s’agit évidemment pas de « dérivation » au sens classique du terme. On notera enfin qu’il existe des lexèmes (appelés « acronymes ») qui sont créés par le biais d’un mécanisme d’abréviation graphique opérant sur la forme écrite d’une expression complexe et qui fournit un sigle. Par exemple, en France, l’expression <revenu minimal d’insertion> a été abrégée graphiquement en <RMI>; ce sigle, prononcé / r mi/, a ensuite fourni le lexème (l’acronyme) RMI dont dérive RMISTE. De même, certains locuteurs de langue espagnole ont repris à l’anglais le sigle USA, qu’ils prononcent /usa/; ce sigle a ensuite fourni le lexème (l’acronyme) espagnol USA, qui entre en composition avec le lexème AMERICANO pour donner le lexème USAMERICANO (condamné par la grammaire normative, qui recommande ESTADOUNIDENSE). Appendice: deux petits exercices (dont le premier résolu) 1. Soit les deux séries de lexèmes qui suivent. En vous fondant sur cet ensemble de données, déterminez la nature du rapport morphologique en jeu. Justifiez votre réponse à l’aide des notions et des principes théoriques précédemment vus: CLOISONNER SERRER MOULER LOYAL DÉCLOISONNER DÉSERRER DÉMOULER DÉLOYAL