Chapitre 2: Les fondements de la morphologie Flexion et dérivation

publicité
13
Chapitre 2: Les fondements de la morphologie
Flexion et dérivation
Introduction
Si l’on postule un niveau d’analyse morphologique dans la description des langues
naturelles, c’est parce qu’on fait l’hypothèse que les mots peuvent posséder une structure d’un
ordre supérieur à leur simple composition en phonèmes, et que cette structure peut être décrite au
moyen d’une unité intermédiaire: le morphème. La hiérarchie segmentale-sémantique se présente
donc, à ce stade, de la manière suivante:
phonème
morphème
mot
Cependant, pour que cette hypothèse ait quelque plausibilité, il convient d’abord de clarifier la
notion intuitive de « mot ».
Occurrences, occurrences de mots; lexèmes, occurrences de lexèmes
Considérons le paragraphe suivant:
Pendant que les guerriers fondent des colonies, les artisans fondent dans le bronze les statues qui
représentent les dieux. La Cité se fond en effet dans un ordre supra-naturel qui la fonde.
Si je demande à mon traitement de texte combien de « mots » apparaissent dans ce passage, il me
répond: 32. Or on peut raisonnablement dire qu’à plusieurs reprises, le même « mot graphique »
apparaît deux ou plusieurs fois à la suite
d’une répétition:
<les…les…les…les>,
<fondent…fondent>, <dans…dans>, <La…la> (en négligeant la différence graphique entre
majuscule et minuscule), <qui…qui>.
Si l’on adopte ce deuxième critère, on dira que le
paragraphe en question renferme bien 32 « occurrences » de mots graphiques, mais seulement 25
mots graphiques. Mais par ailleurs, on dira aussi, par exemple dans une analyse grammaticale,
que <les> dans <les guerriers>, < les artisans>, < les statues>, <les dieux>, <le> dans <le
bronze> et <La> dans < La Cité> sont des « formes » du même « mot », l’article défini; que
<fondent> dans <fondent des colonies> et <fonde> sont des « formes » du même mot, le verbe
14
<fonder>; que <fondent> dans < fondent dans le bronze> et <fond> sont des « formes » du
même mot, le verbe <fondre>. Ce troisième mode de comptage aboutit au nombre 24.
Pour clarifier les choses, il convient d’introduire la notion de « lexème ». Un lexème est
une unité plus abstraite que le mot graphique (ou phonologique), et qui est donc susceptible de se
manifester à travers plusieurs mots graphiques (ou phonologiques) qui sont ses « formes ». Afin
de désigner les lexèmes qui peuvent se manifester à travers plusieurs formes, la grammaire et la
lexicologie traditionnelles choisissent l’une de ces formes sur une base systématique: par exemple,
pour les lexèmes verbaux, la tradition française choisit la forme infinitive, mais la tradition latine
choisit la première personne du singulier de l’infectum de l’indicatif présent (dans le cas où celleci existe); pour les lexèmes nominaux, les traditions française et latine choisissent le masculin
(dans le cas où celui-ci existe) et le singulier (dans le cas où celui-ci existe). Désormais, nous
adopterons les mêmes conventions, mais en écrivant le nom des lexèmes en majuscules (sans
crochets angulaires adjacents, car cette notation nous servira aussi pour l’analyse du langage oral);
nous parlerons donc du lexème FAIRE en français, du lexème FACIO en latin, etc.
Dans les cas où la forme communément utilisée n’existe pas (voir plus loin), le choix obéit encore à une
convention stable. Par exemple, pour les lexèmes verbaux du latin, on emploie alors la première personne
du singulier du perfectum de l’indicatif présent (exemple: ODI).
Il est important de noter que des suites de lettres (ou de phonèmes) qui comptent comme
des occurrences du même mot graphique (ou phonologique) ne comptent pas nécessairement
comme des occurrences du même lexème. Par exemple, <fondent> dans <fondent des colonies>
et <fondent> dans < fondent dans le bronze> comptent comme deux occurrences du même mot
graphique <fondent>, mais non comme deux occurrences du même lexème. Il faut donc travailler
avec une classification à quatre termes:
Mots graphiques/phonologiques
Lexèmes
<fondent>, <fond>, <fonde>
FONDER, FONDRE
Occurrences <fondent>, <fondent>, <fond>, <fonde>
FONDER, FONDRE, FONDRE, FONDER
Dans les traitements automatiques offerts par des bases de données électroniques (comme
FRANTEXT à l’Institut National de la Langue Française), la différence entre ces différents niveaux
d’analyse se laisse caractériser au moyen des termes « lemmatisation », « catégorisation » et
« analyse ». Si un outil de ce genre n’offre ni lemmatisation, ni catégorisation, ni analyse (comme
cela se passe aussi avec les traitements de texte), alors on ne peut y rechercher toutes les
15
occurrences d’un lexème comme FONDRE sans rechercher toutes les occurrences de chacune de
ses formes; on obtient alors, en sus, toutes les occurrences de certaines des formes de FONDER
et toutes les occurrences de toutes les formes des lexèmes nominaux FOND et FONDS. S’il y
lemmatisation, alors on peut rechercher d’un coup toutes les occurrences du lexème FONDRE
(qui est un « lemme »), mais on obtient toujours, en sus, toutes les occurrences de certaines des
formes de FONDER et toutes les occurrences de toutes les formes des lexèmes nominaux FOND
et FONDS.
S’il y a catégorisation (par exemple, en tant que « verbe » ou « nom ») des
occurrences, alors on peut rechercher d’un coup toutes les occurrences du lexème FONDRE, mais
on obtient toujours, en sus, toutes les occurrences de certaines des formes de FONDER. S’il y a
analyse, on peut rechercher d’un coup toutes les occurrences du lexème FONDRE, sans obtenir,
en sus, toutes les occurrences de certaines des formes de FONDER; mais certains fragments
résisteront toujours à une analyse automatique.
Flexion et dérivation: caractérisation générale
La morphologie traditionnelle repose sur la distinction entre « flexion » et « dérivation ».
Cet outil conceptuel fondamental est souvent introduit de manière assez confuse, dans la mesure
où la différence entre mot (graphique ou phonologique) et lexème n’est pas suffisamment clarifiée,
et où l’on confond souvent l’analyse des relations (ou rapports) morphologiques avec celle des
procédés (ou processus) susceptibles de manifester ces relations.
Les termes « relation » et « rapport » doivent être entendus ici comme de parfaits synonymes. Par contre,
nous aurons à revenir sur le différence entre « procédé » et « processus » (souvent neutralisée dans l’usage
courant du mot anglais « process »); pour l’instant, nous n’utiliserons que « procédé ».
En première approximation, on peut dire qu’une relation de flexion s’instaure entre mots
graphiques ou phonologiques, tandis qu’une relation de dérivation s’instaure entre lexèmes.
Autrement dit encore, les termes d’une relation de flexion appartiennent au domaine des
« formes », tandis que les termes d’une relation de dérivation appartiennent au lexique. Par
exemple, cela a un sens d’établir une relation de flexion entre <chante> et <chanterai>, et une
relation de dérivation entre CHANTER et CHANTEUR; mais cela n’a aucun sens d’établir une
relation de dérivation entre <chanter> et <chanteur> plutôt qu’entre <chantait> et <chanteuse>,
ou une relation de flexion entre CHANTEUR et *CHANTEURS (qui n’est pas un lexème du
français).
16
Les relations de flexion et de dérivation se différencient aussi par leurs propriétés logiques.
La relation de flexion est une relation d’équivalence (donc une relation réflexive, symétrique et
transitive) dans l’ensemble de tous les mots (graphiques ou phonologiques). Comme toute
relation d’équivalence est réflexive, il s’ensuit que la relation de flexion est « totale » dans
l’ensemble des mots d’une langue: en effet, puisque tout mot entre en relation de flexion avec luimême, il s’ensuit que tout mot entre dans la relation de flexion avec au moins un mot.
Par
ailleurs, une relation d’équivalence dans un ensemble définit une partition de cet ensemble en
classes d’équivalence (c’est-à-dire, techniquement, un ensemble de parties non-vides disjointes
deux à deux, dont l’union égale l’ensemble en question); dès lors, la relation de flexion définit une
partition de l’ensemble des mots d’une langue en classes d’équivalence.
Pour concrétiser les choses, considérons l’ensemble des citoyens belges actuellement en vie. La relation
« avoir la même taille que » est une relation d’équivalence dans cet ensemble. En effet, toute personne a la
même taille qu’elle-même (réflexivité); si A a la même taille que B, alors B a la même taille que A
(symétrie); si B a la même taille que A, et que C a la même taille que B, alors C a la même taille que A
(transitivité). Pour autant qu’on se donne un ensemble discret de mesures de tailles (c’est-à-dire qu’on
s’arrête par exemple au centimètre en se mettant d’accord sur une procédure d’approximation par
« arrondissement » vers le haut ou vers le bas), cette relation définit une partition aisément concevable de
manière intuitive. Cette relation est aussi totale, car même si j’ai une taille de 3,20m, il existe une classe
d’équivalence dont je suis le seul élément; aucun citoyen belge actuellement en vie ne saurait donc tomber
« en dehors » de la partition en cause.
La relation de dérivation est une relation d’ordre irréflexive, asymétrique et intransitive
dans l’ensemble des lexèmes d’une langue. C’est aussi une relation qui peut être « partielle » (et
qui, dans les faits, est toujours partielle) en ce sens qu’il est possible (et, dans les faits, toujours
vérifié) que certains lexèmes n’entrent en relation de dérivation avec aucun lexème (ce qui exige
l’irréflexivité).
Pour concrétiser les choses, considérons de nouveau l’ensemble des citoyens belges actuellement en vie.
La relation « avoir la taille immédiatement inférieure à celle de » est une relation d’ordre irréflexive,
asymétrique et intransitive dans cet ensemble. En effet, personne n’a la taille immédiatement inférieure à la
sienne propre (irréflexivité); si A a la taille immédiatement inférieure à celle de B, alors B n’a pas la taille
immédiatement inférieure à celle de A (asymétrie); si B a la taille immédiatement inférieure à celle de A, et
C a la taille immédiatement inférieure à celle de B, alors C n’a pas la taille immédiatement inférieure à
celle de A (intransitivité). Cette relation peut être partielle, car si aucun citoyen belge ne mesure 1,21m et
qu’aucun citoyen belge ne mesure 1,23m, alors celui qui se trouverait mesurer 1,22 ne saurait constituer
l’un des termes de la relation « avoir la taille immédiatement inférieure à celle de ».
Propriétés empiriques de la flexion
La théorie morphologique se donne comme contrainte empirique que chacune des classes
d’équivalence définies par la relation de flexion doit se voir correspondre un et un seul lexème.
Comme nous le verrons bientôt, l’inverse n’est pas vrai: certains lexèmes se voient correspondre plus d’une
classe flexionnelle.
Ceci impose que les mots graphiques ou phonologiques qui peuvent réaliser des lexèmes
différents soient expressément distingués (« désambiguïsés »): on devra donc distinguer
17
<fondent 1>, forme de FONDER, de <fondent 2>, forme de FONDRE, etc. En effet, si ce n’était
pas le cas, <fondent> entrerait en relation de flexion à la fois avec <fondera> et avec <fondra>; et
comme la relation est symétrique et transitive, on aboutirait à ce que <fondera> entre en relation
de flexion avec <fondra>, ce qui entraînerait l’impossibilité d’encore distinguer les lexèmes
FONDER et FONDRE.
Si <fondent> est en relation de flexion à la fois avec <fondera> et <fondra>, alors (par symétrie) <fondera>
est en relation de flexion avec <fondent>; et comme <fondent> est en relation de flexion avec <fondra>, il
s’ensuit (par transitivité) que <fondera> est en relation de flexion avec <fondra>. Dès lors, les lexèmes
FONDER et FONDRE ne sont plus distingués.
Si un lexème a au moins deux formes distinctes appartenant à la même classe flexionnelle,
il doit être possible de décrire chacune d’entre elles comme la combinaison de ce lexème avec les
« valeurs » d’une série de « catégories morphologiques » comme le Genre, le Nombre, le Cas, la
Conjugaison, l’Aspect, le Mode, le Temps, la Personne, etc. Par exemple, la forme <fondera>
sera décrite comme la combinaison du lexème FONDER avec la valeur [première] de la catégorie
de la Conjugaison, la valeur [indicatif] de la catégorie du Mode, la valeur [futurpr] de la catégorie
du Temps, la valeur [3] de la catégorie de la Personne, et la valeur [singulier] de la catégorie du
Nombre. On exige, bien évidemment, qu’à chaque catégorie correspondent au moins deux valeurs;
sinon, la notion même de catégorie morphologique perdrait tout intérêt descriptif.
Dans la morphologie traditionnelle, l’inventaire des catégories morphologiques, et des valeurs
correspondant à chacune d’elles, sert à définir ce qu’on appelle la « déclinaison » (caractéristique des
lexèmes nominaux au sens large du terme — adjectifs, pronoms et déterminants compris) et la
« conjugaison » (caractéristique des lexèmes verbaux). Autrement dit, cette dichotomie morphologique
correspond à la dichotomie syntaxique fondamentale entre nom et verbe. Depuis toujours, cette analyse
s’est heurtée à l’existence de formes « hybrides » comme le « participe » (qui tire son nom, justement, de
ce qu’il « participe » du nom et du verbe).
Comme nous venons de le faire, nous noterons dorénavant les noms des catégories
morphologiques avec une majuscule initiale, et les noms des valeurs morphologiques en caractères
ordinaires flanqués de crochets droits.
Les lexèmes qui possèdent une flexion sont dits
« variables ». Certains lexèmes (comme les prépositions françaises, par exemple) sont donc dits
« invariables », en ce sens qu’ils ne se combinent avec aucune valeur morphologique.
On peut ainsi décrire n’importe quel mot comme la combinaison d’un lexème avec n
valeurs morphologiques — n étant égal à 0 pour les lexèmes invariables, et plus grand ou égal à 1
pour les lexèmes variables. La combinaison des lexèmes avec les valeurs morphologiques est une
opération commutative, que nous noterons au moyen du signe « & ».
18
L’addition de l’arithmétique élémentaire est commutative, car 3+6 = 6+3 = 9. De même,
FONDER & [première] & [indicatif] & [futurpr] & [3] & [singulier]
n’est pas différent de:
[première] & FONDER & [3] & [singulier] & [indicatif] & [futurpr]
Cette opération obéit à la contrainte générale qu’aucun mot n’est définissable par la combinaison
d’un certain lexème avec deux valeurs de la même catégorie morphologique.
Par exemple, la combinaison FONDER & [première] & [indicatif] & [futurpr] & [3] & [2] & [singulier] ne
définit aucun mot.
Il convient de remarquer qu’il ne saurait être question de réclamer qu’à chaque lexème
corresponde une et une seule classe d’équivalence de mots (graphiques ou phonologiques) en
termes flexionnels. Soit, par exemple, le lexème prépositionnel français APRÈS, que l’on peut
prononcer /apr /, par exemple dans <après les fêtes>, ou /apr z/, par exemple dans <après avoir
choisi>. La théorie morphologique exclut qu’une relation de flexion s’instaure entre /apr / et
/apr z/, puisque APRÈS est un lexème invariable. Celui-ci se voit donc correspondre deux classes
d’équivalence flexionnelles, à savoir {/apr /} et {/apr z/}.
Par ailleurs, il est possible que la combinaison d’un certain lexème avec les valeurs
morphologiques requises définisse deux ou plusieurs mots.
Par exemple, la combinaison du
lexème FONDER avec les valeurs [première], [indicatif], [futurpr], [3] et [singulier] définit les
mots phonologiques suivants, qui appartiennent tous à la même classe flexionnelle:
/f dra1/
/f dŒra/
dans <fondera des villes>
/f drat1/
/f dŒrat/
dans <fondera-t-elle>
Le choix entre /apr / et /apr z/, ou entre /f dra1/, /f dŒra/, /f drat1/ ou /f dŒrat/, n’est
pas déterminé par la morphologie, mais bien par les règles qui président à la formation des
groupes prosodiques correspondant aux groupes clitiques ou aux syntagmes; nous y reviendrons
dans la partie syntaxique du cours.
Par ailleurs, la flexion se caractérise par deux autres propriétés empiriques, à savoir la
complétude et l’absence de filtrage sémantique.
La complétude
La propriété de complétude peut être définie comme le fait qu’en principe, un lexème peut
prendre toutes les valeurs de toutes les catégories morphologiques avec lesquelles il est
combinable. Considérons, par exemple, un lexème verbal récemment entré en français comme
FORWARDER: tout locuteur s’est initialement familiarisé avec ce lexème à travers une forme
déterminée; il n’empêche que toute la conjugaison de ce verbe (<forwarde>, <forwardait>,
<forwarderai>, <forwardé>, etc.) est accessible à n’importe quel locuteur. Cette caractéristique
19
de la flexion contribue à assurer ce que nous avons appelé la « détachabilité » de l’information.
En effet, si tel n’était pas le cas, je ne pourrais dire « Pierre me forwardera le message demain »
pour rapporter l’information que Pierre m’a transmise en disant « Je te forwarderai le message
après-demain ».
La complétude connaît cependant certaines limitations.
Toutes les grammaires
enregistrent, par exemple, l’existence de ce qu’on appelle des « verbes défectifs », à flexion
incomplète: par exemple, le lexème verbal latin ODI ne se combine qu’avec la valeur [perfectum]
de la catégorie de l’Aspect. Mais en général, l’inventaire de ces verbes est gonflé, dans la mesure
où l’on ne tient pas suffisamment compte de facteurs syntaxico-sémantiques ou phonologiques.
Prenons le cas des lexèmes FALLOIR et PLEUVOIR. Le fait qu’on ne trouve ni <*nous
fallons>, ni <???nous pleuvons> ne relève pas de la morphologie, car des constructions telles que
<*nous allons falloir> ou <???nous voulons pleuvoir> sont tout aussi inacceptables, alors que la
forme <falloir> ou <pleuvoir> n’est en rien problématique, comme le montrent des exemples
comme <Il va falloir jouer serré> ou <Il va pleuvoir>. On notera que si <???nous pleuvons> est
un peu moins mauvais que <*nous fallons>, c’est pour la même raison qui fait que <???nous
voulons pleuvoir> est un peu moins mauvais que <*nous allons falloir>: en effet, on pourrait
imaginer que, dans un récit poétique, des gouttes de pluie disent, de leur charmante voix
cristalline, <???nous pleuvons> ou <???nous voulons pleuvoir>. De même, le verbe FRIRE est
considéré comme défectif car on ne trouve pas de formes telles que <*frions>, <*friais>,
<???frira>, etc. (les jugements d’acceptabilité sont ceux de l’auteur de ces lignes). Mais on
observe que des formes non problématiques comme <frire> ou <frit> connaissent de sérieuses
limitations d’emploi: dans le français de l’auteur de ces lignes, la phrase <??On doit frire ce
poisson> est difficile, comparée à <On doit faire frire ce poisson>; de même, <??Maman a frit les
pommes de terre> est difficile, comparée à <Maman a fait frire les pommes de terre>. Du côté de
la phonologie, c’est souvent l’incertitude quant à la forme à employer qui génère la défectivité.
Par exemple, la forme <courrais>, banale à l’écrit, pose de sérieux problèmes à l’oral car elle exige
une gémination du /r/ ce qui exceptionnel en français (seules les formes correspondantes de
MOURIR présentent la même caractéristique). Certains sujets produisent /kurir / ou /kurŒr /,
qui sont des formes réputées incorrectes; on assiste alors à une stratégie d’évitement, qui consiste
tout simplement à ne pas utiliser ce futur du passé dans le discours oral spontané. De même,
pour le futur du présent de BOUILLIR, troisième personne du singulier, de nombreux locuteurs
hésitent entre /bujira/, /bura/, /buŒra/ et /bu:ra/ avec un /u:/ long; de nouveau, la solution consiste
20
à éviter ce genre de formes. À côté de ces phénomènes à causalité syntaxico-sémantique ou
phonologique, il existe des cas plus troublants, comme celui du verbe RENAÎTRE qui pose des
problèmes au passé simple (<??À cette époque, le Romantisme renaquit>) et au participe passé
(<???À cette époque, le Romantisme est rené>), alors que des phrases telles que <À cette
époque, le Romantisme commença à renaître> ou <À cette époque, le Romantisme a commencé à
renaître> ne posent aucun problème. Les causes de telles anomalies restent mal comprises.
La complétude connaît une autre limitation due au fait que, dans certaines langues,
certaines catégories de lexèmes tendent à contraindre lexicalement les valeurs de certaines
catégories morphologiques. C’est le cas, en latin et dans les langues romanes, pour la quasitotalité des lexèmes verbaux, qui contraignent la valeur prise par la catégorie Conjugaison, et pour
la très grande majorité des lexèmes substantivaux, qui ont ce qu’on appelle un Genre
« grammatical » ou « intrinsèque ». Par exemple, en français, le lexème TABLEAU n’a pas de
féminin, et le lexème TABLE n’a pas de masculin; ceci n’est pas vrai de tous les lexèmes
substantivaux, témoins CHIEN ou CHANTEUR, mais il faut alors que la variation en Genre soit
corrélée à une variation sémantique de sexe.
Du point de vue technique, si un lexème L ne se combine qu’avec une valeur déterminée
[v] d’une catégorie morphologique C, alors le lexique ne contient pas L tout court, mais bien la
combinaison L & [v]. Par exemple, le lexique latin ne contient pas ODI tout court, mais bien la
combinaison ODI & [perfectum]. De même, le lexique français ne contient pas CHANTER tout
court, mais bien la combinaison CHANTER & [première]; il ne contient pas TABLEAU tout
court, mais la combinaison TABLEAU & [masculin]; par contre, il contient CHIEN tout court.
Les adjectifs se distinguent des substantifs par le fait qu’ils ne possèdent pas de Genre
intrinsèque. La raison en est, bien entendu, qu’il existe un mécanisme syntaxique qui déclenche
l’accord en Genre de l’adjectif vis-à-vis du substantif dans toute une série de constructions. Si
certains adjectifs, comme GRAND par exemple, avaient un Genre intrinsèque (par exemple le
masculin), on pourrait les utiliser pour attribuer la propriété de grandeur à un tableau, mais pas à
une table; la puissance d’expression du système linguistique s’en trouverait très sérieusement
compromise.
Deux remarques à ce propos. Un lexème adjectival comme MARRON possède bel et bien un féminin,
même si les formes féminines ne se distinguent pas des formes masculines; sinon, on ne pourrait dire <une
robe marron>, <des robes marron>. D’autre part, un adjectif comme ENCEINTE ne possède pas un Genre
intrinsèque, et n’est donc en aucune manière « défectif ». L’impossibilité (relative) de <?Un garçon
enceinte> ou celle, plus nette, de <???Un garçon enceint> a une source sémantique évidente. On notera
que, si j’ai une jeune copine qui porte des cheveux courts, conduit une moto, raconte des blagues
cochonnes, tape dans le dos de ses amis routiers,… mais se trouve néanmoins porter un enfant, il devient
possible de la décrire comme <?Un garçon enceinte>; l’hybridité de la construction reflétant bien
l’hybridité du personnage.
21
L’absence de filtrage sémantique
Cette propriété peut se caractériser négativement par le biais d’une expérience de pensée.
Soit le verbe BATTRE et les phrases <Elle bat son mari>, <Le paysan bat le blé>, <Pierre bat la
campagne>, <Le Brésil bat l’Argentine>, etc. Supposons que, conjugué à l’imparfait, ce lexème
ne puisse plus avoir d’autre signification que celle qu’on trouve dans la phrase <Elle bat son
mari> (pour désigner un certain type d’action exercé par un individu humain sur un autre individu
humain). On pourrait alors dire <Elle battait son mari>, mais non <*Le paysan battait le blé>,
<*Pierre battait la campagne>, <*Le Brésil battait l’Argentine>, etc. De nouveau, la puissance
d’expression du système linguistique serait gravement compromise, car de nombreuses
informations cesseraient d’être « détachables ». L’absence de filtrage sémantique consiste donc
dans le fait qu’un lexème conserve l’ensemble de ses potentialités sémantiques à travers toute sa
flexion, c’est-à-dire quel que soit le mot qui le réalise. Les seules différences sémantiques qui
séparent nécessairement <bat> de <battait> doivent être dues aux valeurs respectives que
prennent les diverses catégories morphologiques impliquées.
Cette propriété empirique a des conséquences assez remarquables. Ainsi, des lexèmes
apparentés comme BATTEUR et BATTEUSE, qui dérivent tous les deux de BATTRE (nous le
verrons plus bas), peuvent présenter une alternance formelle analogue à celle que l’on trouve entre
<chanteur(s)> et <chanteuse(s)>. Mais si <chanteur(s)> est le masculin de CHANTEUR, et
<chanteuse(s)> le féminin de CHANTEUR, rien ne nous autorise à dire que <batteur(s)> est le
masculin de BATTEUR et <batteuse(s)> le féminin de BATTEUR. En effet, les potentialités
sémantiques de BATTEUR (donc de <batteur(s)) et celles de BATTEUSE (donc de batteuse(s))
diffèrent du tout au tout: dans un cas, il s’agit d’un(e) instrumentiste (ou d’un type de joueur
dans un certain sport américain qui reste parfaitement opaque à l’auteur de ces lignes), dans
l’autre d’un engin agricole ou d’un ustensile de cuisine.
Il faut donc considérer que tant
BATTEUR que BATTEUSE ont un genre « intrinsèque » ou « grammatical ».
Il en va de même, en espagnol, pour des paires de lexèmes comme CESTO-CESTA, CUBO-CUBA,
CHARCO-CHARCA, HUERTO-HUERTA, etc. où la différence sémantique s’établit en référence à la taille
des entités désignées (une entité désignable par le lexème féminin, par exemple HUERTA « culture
maraîchère », étant en principe plus grande que l’entité désignable par le lexème masculin, par exemple
HUERTO « verger »).
22
Propriétés empiriques de la dérivation
Comme nous l’avons dit plus haut, la dérivation est une relation d’ordre irréflexive,
asymétrique, intransitive et partielle dans l’ensemble des lexèmes d’une langue.
Nous la
représenterons schématiquement de la manière suivante:
Lexème de base (ex. CHANTER)
Lexème dérivé (ex. CHANTEUR)
{<chanter>, <chantais>, <chanterons>, etc.}
{<chanteur>, <chanteuse>, <chanteurs>, <chanteuses>}
On voit que, dans ce genre de cas, la relation entre les deux lexèmes peut évidemment se concevoir
comme une relation entre deux classes d’équivalence flexionnelles; mais, comme nous l’avons dit,
rien n’autorise à établir une relation de dérivation entre <chanter> et <chanteur> plutôt qu’entre
<chantais> et <chanteuse>, par exemple.
Il faut également insister sur le fait qu’un lexème n’est dit « de base » que par rapport à un
certain lexème qui en est « dérivé » et vice-versa. Il existe, certes, des lexèmes qui ne sont les
dérivés d’aucun autre lexème (c’est notamment le cas pour ceux qui n’entrent dans aucune relation
de dérivation, par exemple ARAUCARIA), mais rien n’empêche un lexème d’être à la fois « de
base » (par rapport à un certain autre lexème) et « dérivé » (par rapport à un lexème évidemment
distinct du précédent). C’est ce que l’on observe, par exemple, pour SOLUBLE, dérivé de
RÉSOUDRE et lexème de base par rapport à INSOLUBLE:
RÉSOUDRE
SOLUBLE
INSOLUBLE
Pour distinguer empiriquement la flexion de la dérivation, on a utilisé un certain nombre de
critères qui ne se révèlent pas tous également satisfaisants.
Le premier critère est catégoriel. Si deux mots rentrent dans une relation de flexion, ils
appartiennent nécessairement à la même catégorie grammaticale (dans la mesure où l’on a toujours
essayé de rattacher les types de flexion — par exemple la déclinaison et la conjugaison — aux
catégories syntaxiques les plus fondamentales). Par contre, si deux lexèmes entrent dans une
relation de dérivation, ils peuvent — mais ne doivent pas — appartenir à des catégories
grammaticales distinctes; par exemple, on a:
RÉSOUDRE
SOLUBLE
à côté de:
FAIRE
DÉFAIRE
Ce critère est faible pour deux raisons. D’abord, il y a un risque de circularité entre la
catégorisation syntaxique et l’analyse morphologique. Ensuite, un rapport morphologique qui
préserve la catégorisation syntaxique peut toujours relever, a priori, de la flexion ou de la
23
dérivation. Le cas des adverbes latins ou français illustre bien cette difficulté, et la manière dont
on peut la surmonter. Soit une forme adverbiale clairement apparentée à une forme adjectivale,
par exemple en latin /
/, apparenté à /
/, /
/, etc. ou en français,
<parfaitement> apparenté à <parfait>, <parfaite>, etc. Si l’on regroupe la forme adverbiale et les
formes adjectivales sous la même entrée lexicographique, comme on le fait souvent en latin, cela
implique qu’une relation de flexion s’instaure entre elles; mais si tel est le cas, alors on ne peut
plus maintenir que l’adjectif et l’adverbe sont deux catégories syntaxiques distinctes.
résoudre le problème, on fait généralement observer qu’il existe des adverbes, comme /
Pour
/
en latin ou <bigrement> en français, qui ne sauraient entrer en relation de flexion avec une forme
adjectivale; en effet, /
/ est dérivé du lexème prépositionnel-adverbial CIRCA et
<bigrement> est dérivé de l’interjection BIGRE. Par conséquent, il est préférable de conserver la
catégorie syntaxique de l’adverbe, en admettant que le lexème de base puisse être, entre autres
choses, de catégorie adjectivale.
L’exemple des adverbes nous conduit à un autre critère, d’application très délicate
malheureusement, qui a à voir avec ce que l’on pourrait appeler la « productivité ». En gros, il
consiste à montrer qu’il est fréquent de trouver des lexèmes dérivés dont les formes présentent
des similitudes formelles, mais sans qu’on puisse retourner, à partir de chacun d’entre eux, vers
un lexème de base appartement toujours à la même catégorie. Ainsi, /
/ et /
/ se
ressemblent formellement, mais il n’est pas possible de retourner dans les deux cas (pour
FELICITER comme pour CIRCITER) à une base adjectivale; <parfaitement> et <bigrement> se
ressemblent, mais il n’est pas possible de retourner dans les deux cas (pour PARFAITEMENT
comme pour BIGREMENT) à une base adjectivale. On retrouve le même phénomène dans la
série suivante:
FAIRE
DÉFAIRE
ZIPPER
DÉZIPPER
DÉROUTER
DÉBALLONNER
En effet, DÉROUTER n’est pas un dérivé d’un lexème *ROUTER (que l’auteur de ces lignes ne
possède pas dans son lexique) mais plutôt de ROUTE; et DÉBALLONNER ne semble pas lié à
BALLONNER, mais plutôt à l’adjectif GONFLÉ (au sens de « audacieux, agressif, etc. ») qui
connaîtrait dès lors deux dérivés très proches, à emploi pronominal: DÉGONFLER (dans le sens
de « perdre toute son audace ») et DÉBALLONNER.
24
En revanche, la propriété d’incomplétude et la présence d’un filtrage sémantique semblent
mieux caractériser la dérivation par rapport à la flexion.
L’incomplétude
De manière générale, l’existence d’un nombre, même important, de couples lexème de base
de catégorie Ci - lexème dérivé de catégorie Cj (avec i égal à, ou différent de, j), même
accompagnée d’une très grande similitude des formes impliquées, ne suffit pas à garantir qu’à un
lexème donné, qui pourrait alors fournir une base, corresponde un lexème dérivé existant. Par
exemple, à partir des paires:
CHANTER
CHANTEUR
SOUDER
SOUDEUR
TRIPOTER
TRIPOTEUR
DRAGUER
DRAGUEUR
NAGER
NAGEUR
DESCENDRE
DESCENDEUR
etc.
peut-on poser, aussi banalement:
BOMBARDER
??BOMBARDEUR
EXPLIQUER
??EXPLIQUEUR
SIGNALER
??SIGNALEUR
etc.
La réponse est évidemment négative.
Certains rejettent cet argument dans les termes suivants. Si je dis du maréchal Goering,
dont le goût pour les bombardements massifs est bien connu, que c’était un <bombardeur>, tout
le monde me comprendra; de même, si je dis d’un enseignant qui s’attarde volontiers (comme le
fait Bibi pour le moment) dans de longues explications, que c’est un <expliqueur>, tout le monde
me comprendra aussi. Mais le problème n’est pas là. Si quelqu’un me dit <je te forwarderai le
message demain>, alors que je n’ai jamais entendu la forme <forwarderai> précédemment, je n’ai
pas l’impression qu’il a accompli une création lexicale; et s’il s’agit d’un étudiant non-natif, je
n’éprouverai pas la tentation de lui dire de ne pas utiliser cette forme alors que j’accepterais qu’il
dise <forwarde> ou <forwardais>.
Par contre, si j’entends produire <bombardeur> dans la
situation décrite, je pourrai y voir une création adroite, sarcastique, etc. si cela vient de la bouche
25
d’un chroniqueur du Monde, mais déconseiller fortement un tel usage à un étudiant non-natif, en
lui disant que « ce mot n’existe pas ». L’incomplétude se laisse donc caractériser de la manière
suivante: toute exploitation nouvelle d’une régularité de dérivation dans le chef d’un locuteur est
une création lexicale de sa part; et l’acceptation de cette activité créatrice dépend, pour une part,
du statut de ce locuteur, de la situation d’échange où l’on se trouve, etc.
Le filtrage sémantique
Dans la dérivation, le filtrage sémantique se manifeste par le fait que les potentialités
sémantiques du lexème dérivé ne recouvrent qu’une partie, parfois infime, des potentialités
sémantiques du lexème de base. Par exemple, le lexème BATTEUR (si l’on néglige l’usage qu’on
en fait pour parler du base-ball, usage que l’auteur de ces lignes ne maîtrise pas) ne retient, du
lexème de base BATTRE, que les potentialités sémantiques présentes dans des expressions telles
que <battre le rythme>. On observe aussi que des dérivés d’une même base se différencient
presque toujours à cet égard. Ainsi BLANCHIMENT et BLANCHISSAGE dérivent tous deux
de BLANCHIR, mais si on peut <blanchir de l’argent> et <blanchir du linge>, on ne peut parler
d’un <*blanchissage d’argent sale> ou d’un <???commerce de repassage et blanchiment de lingerie
délicate>. De même encore, RAFFINEMENT et RAFFINAGE dérivent de RAFFINER, mais si
on peut <raffiner du pétrole> et <raffiner sans cesse davantage l’analyse du sonnet italien>, on ne
peut parler du <*raffinement du pétrole> ou d’un <*raffinage excessif dans l’analyse du sonnet
italien>. Même les régularités de dérivation les plus massives n’échappent pas à ce phénomène;
ainsi DÉPEUPLER vis-à-vis de PEUPLER: à côté de <Les souvenirs de l’Espagne peuplent mes
souvenirs>, on ne saurait trouver <*Mon angoisse dépeuple mes souvenirs>.
Si l’ensemble des potentialités sémantiques du dérivé doit être inclus (et est, dans les faits,
strictement inclus) dans l’ensemble des potentialités sémantiques de la base, il s’ensuit que
lorsqu’un dérivé se trouve posséder une potentialité sémantique étrangère (ou devenue étrangère)
à la base, alors un lexème indépendant de celle-ci existe (ou émerge) dans le lexique. C’est le cas,
par exemple, de IMPERTINENT, qui était auparavant un dérivé de PERTINENT, rôle dans
lequel il a été remplacé par NON-PERTINENT.
Certains locuteurs acceptent encore <Cet argument est impertinent>, au sens de « Cet argument n’est pas
pertinent ». Pour décrire leur usage, il faut distinguer deux lexèmes IMPERTINENT1 et IMPERTINENT2
dont l’un seulement est un dérivé de PERTINENT (et se trouve dès lors en concurrence avec NONPERTINENT). On notera la source de ce phénomène: l’une des manières de se montrer impertinent ou
impoli dans la conversation est de se montrer non-pertinent.
26
Il convient de noter, à cet égard, que le filtrage sémantique permet de montrer en quoi
l’ordre postulé entre une base et son dérivé permet de maintenir une économie considérable dans
la description du lexique, en autorisant une importante dose de « polysémie ».
Prenons de
nouveau à titre d’exemple le verbe BATTRE et certains de ses dérivés:
BATTRE
BATTEUR
BATTRE
BATTEUSE
BATTRE
BATTANT
BATTRE
BATTAGE
BATTRE
BATTEMENT
etc.
Si l’on posait un ordre de dérivation inverse, soit:
*(BATTEUR
BATTRE)
BATTEUSE
BATTRE)
*(BATTANT
BATTRE)
*(BATTAGE
BATTRE)
*(BATTEMENT
BATTRE)
etc.
on aboutirait à un résultat inacceptable, car le dérivé (BATTRE) aurait chaque fois des
potentialités sémantiques étrangères à celles de la base. Il faudrait donc multiplier les lexèmes
BATTRE1, BATTRE2, BATTRE3, etc., ce qui aboutirait à remplacer une « polysémie » massive
par une énorme quantité d’homonymies.
Quelques précisions et quelques interrogations au sujet de la dérivation
Le fait de postuler une relation de dérivation entre un lexème de base et un lexème dérivé
ne signifie ni que la base soit diachroniquement plus ancienne que le dérivé, ni qu’elle connaisse
un usage plus normal ou plus fréquent que celui-ci.
Pour illustrer le premier point, considérons le lexème FLAMMABLE « inflammable » en
anglais des États-Unis. On sait que, dans cet emploi, la forme <flammable> est issue d’une
analyse, étymologiquement erronée, de la forme <inflammable> comme signifiant non pas
« inflammable » mais « non susceptible de prendre feu ». En d’autres termes, chez les locuteurs
qui ont créé ce lexème, INFLAMMABLE était un dérivé de FLAMMABLE, comme
27
IMPOSSIBLE l’est de POSSIBLE; mais cela n’empêche que FLAMMABLE est apparu après
INFLAMMABLE.
Pour illustrer le second point, considérons la série suivante:
BATTRE
?BATTABLE
IMBATTABLE
FROISSER
FROISSABLE
INFROISSABLE
DÉCRIRE
DESCRIPTIBLE
INDESCRIPTIBLE
ÉCOUTER
??ÉCOUTABLE
?INÉCOUTABLE
etc.
Dans cette série, le dérivé à signification négative est, dans des proportions très variables selon les
cas, d’un usage plus normal et plus fréquent que la base dont il dérive. Un lexème comme
?BATTABLE ou ??ÉCOUTABLE, dans la mesure où il existe, ne s’emploie pratiquement que
dans des phrases du genre <Ce jour-là, l’Argentine (n’)était (pas) battable>, <??Pour une fois, la
blague que Pierre a racontée était écoutable>, etc.
Cette observation nous conduit à aborder un problème extrêmement délicat. Soit les
lexèmes VAINCRE et INVINCIBLE. Si on les compare à la série précédemment discutée, on
constate un problème, à savoir que le lexème de base dont INVINCIBLE devrait dériver n’existe
apparemment pas. A priori, trois solutions peuvent être offertes. La première, qui est celle des
grammaires traditionnelles, consiste à supposer qu’il existe, dans les systèmes morphologiques,
des dérivations « parasynthétiques » qui sautent tout simplement une étape, en faisant dériver un
lexème L3 d’un lexème L1 là où, d’habitude, un lexème analogue à L3 (appelons-le L3’) dérive
d’un lexème L2’ qui dérive lui-même d’un lexème L1’ analogue à L1. Par exemple, la dérivation
« parasynthétique » de INVINCIBLE à partir de VAINCRE se présentera comme suit:
VAINCRE (L1)
BATTRE (L1’)
INVINCIBLE (L3)
BATTABLE (L2’)
IMBATTABLE (L3’)
Une deuxième solution consiste à supposer un lexème L2 (appelons-le « VINCIBLEØ »)
présentant la particularité de posséder une « flexion vide », c’est-à-dire de ne pouvoir être
manifesté par aucun mot:
VAINCRE (L1)
VINCIBLEØ (L2)
INVINCIBLE (L3)
La troisième solution consiste à supposer que BATTABLE, par exemple, est le dérivé à la fois de
BATTRE et de VAINCRE, et est la base à la fois de IMBATTABLE et de INVINCIBLE:
VAINCRE (L1)
BATTABLE (L2)
INVINCIBLE (L3)
BATTRE (L1’)
BATTABLE (L2)
IMBATTABLE (L3’)
28
Aucune de ces solutions n’est satisfaisante.
La première se borne à reformuler le
problème. La deuxième aboutit à ce que la notion de « lexème » tend à se confondre avec la notion
(mentale) de « concept ».
La troisième est empiriquement inadéquate, en ce sens que
INVINCIBLE a des potentialités sémantiques étrangères à celles de BATTABLE: si on peut
parler d’une <bonne humeur invincible>, on ne saurait dire que <*Ce jour-là, la bonne humeur de
Paul n’était pas battable>.
Autres mécanismes de création de lexèmes
Il existe, dans les systèmes linguistiques, des mécanismes de création de lexèmes qui ne
relèvent pas de la dérivation au sens étroit où nous l’avons définie ici.
Parmi ces mécanismes, il convient d’abord de décrire les créations « à parenté multiple »,
où le lexème est créé à partir de deux ou plusieurs lexèmes. On distingue, dans cette classe:
• la composition: TOURNEVIS à partir de TOURNER et VIS, TIRE-BOUCHONS à partir
de TIRER et BOUCHON, MAÎTRE-CHIENS à partir de MAÎTRE et CHIEN,
AMÉRICANO-CHINOIS
à
partir
de
AMÉRICAIN
et
CHINOIS,
FRIGOTARTINABLE à partir de FRIGO et TARTINABLE, etc.
• les « mots-valises », très courants en anglais: BRUNCH à partir de BREAKFAST et
LUNCH, LINGLISH à partir de LINGUIST et ENGLISH, FRANGLAIS à partir de
FRANÇAIS et ANGLAIS, FOULTITUDE à partir de FOULE et MULTITUDE,
BOURREAUCRATE à partir de BOURREAU et BUREAUCRATE, etc.
• des cas comme ISME ou ALGIE: ISME à partir de SOCIALISME, LIBÉRALISME,
COMMUNISME, etc. (quand on dit <Il faut libérer de tous les ismes>); ALGIE, à partir
de NÉVRALGIE, LOMBALGIE, SCIATALGIE, etc. (quand on dit <Notre époque se
caractérise par une attention plus forte portée aux algies>).
On trouve ensuite des cas où le lexème est créé à partir d’une expression syntaxique, c’està-dire d’une combinaison libre de lexèmes: TROP-PLEIN, TROP-PERÇU. Parfois l’existence
d’un tel lexème n’est établie que par le biais de la dérivation, au sens classique du terme. Par
exemple, l’existence du lexème PREMIER MINISTRE est établie par l’existence du dérivé
PREMIER MINISTRABLE (noter que la suite <premier ministrable> est ambiguë: soit elle
réalise le lexème PREMIER MINISTRABLE, par exemple dans <Di Rupo fait de plus en plus
figure de premier ministrable>; soit elle réalise la combinaison des lexèmes PREMIER et
MINISTRABLE, par exemple dans <Le premier ministrable de cette liste est Di Rupo; le second,
29
c’est Reynders>).
De même, l’existence du lexème QUART DE FINALE est établie par
l’existence du dérivé QUART DE FINALISTE.
On trouve également des lexèmes obtenus à partir d’une expression susceptible de
constituer une phrase complète: M’AS-TU VU (<Pierre est un m’as-tu vu>); DÉCROCHEZMOI ÇA (<Elle a acheté cette robe au décrochez-moi ça>); JE M’EN FOUTISME à partir de JE
M’EN FOUS; À QUOI BONISME à partir de À QUOI BON; JUSQU’AU BOUTISME à
partir de JUSQU’AU BOUT.
On considère généralement qu’il existe un lien entre l’usage
typique de l’expression phrastique considérée et les potentialités sémantiques du lexème créé: un
<décrochez-moi ça> est un commerce de vêtements où on dit typiquement <Décrochez-moi ça!>,
le <je m’en foutisme> est l’attitude de ceux qui disent typiquement <Je m’en fous>, etc. De ce
point de vue, ce type de création ressemble à ce qui se passe pour des lexèmes comme QUIRITO
en latin, PORDIOSEAR en espagnol, ou BIGREMENT, déjà cité, en français. QUIRITO signifie
« appeler à l’aide » en criant typiquement <Quirites!> « Romains! »; PORDIOSEAR signifier
« mendier » en disant typiquement <¡Por Dios!>; BIGREMENT se dit pour parler de situations
où l’on dirait typiquement <Bigre!>. Ce mécanisme a été baptisé « délocutivité » ou « dérivation
délocutive », mais il ne s’agit évidemment pas de « dérivation » au sens classique du terme.
On notera enfin qu’il existe des lexèmes (appelés « acronymes ») qui sont créés par le
biais d’un mécanisme d’abréviation graphique opérant sur la forme écrite d’une expression
complexe et qui fournit un sigle.
Par exemple, en France, l’expression <revenu minimal
d’insertion> a été abrégée graphiquement en <RMI>; ce sigle, prononcé / r mi/, a ensuite fourni
le lexème (l’acronyme) RMI dont dérive RMISTE.
De même, certains locuteurs de langue
espagnole ont repris à l’anglais le sigle USA, qu’ils prononcent /usa/; ce sigle a ensuite fourni le
lexème (l’acronyme) espagnol USA, qui entre en composition avec le lexème AMERICANO pour
donner le lexème USAMERICANO (condamné par la grammaire normative, qui recommande
ESTADOUNIDENSE).
Appendice: deux petits exercices (dont le premier résolu)
1. Soit les deux séries de lexèmes qui suivent. En vous fondant sur cet ensemble de données,
déterminez la nature du rapport morphologique en jeu. Justifiez votre réponse à l’aide des
notions et des principes théoriques précédemment vus:
CLOISONNER
SERRER
MOULER
LOYAL
DÉCLOISONNER
DÉSERRER
DÉMOULER
DÉLOYAL
Téléchargement