Morphologie et sémantique lexicales Quelques points de repère

publicité
Morphologie et sémantique lexicales
Quelques points de repère
Lexique / vocabulaire
ensemble des unités lexicales d'une langue ensemble ouvert
vs
ensemble des unités employées dans un corpus ; ensemble fermé
Vocabulaire actif / passif
1. Le mot ?!
•
•
•
•
Les mots nous présentent des choses une petite image claire et usuelle (Proust)
va, ira, allons... sont des formes du même mot
le mot « parce que » introduit la cause
faire un bon mot ; glisser un mot etc.
Le mot « mot » est polysémique !
Qu’est-ce qu’un mot ? Pour des élèves de CP :
• lettres, espaces, apostrophe, alphabet (il y a des grands et des petits mots)
• textes, dictionnaires, livres, albums, documentaires, histoires, journaux…
• pour lire (des histoires aux enfants) / écrire (un message au maître) / apprendre (ce que
mangent les poissons ; les nouvelles dans le journal) / faire (par ex. la cuisine)
• avec des espaces et des lettres qui servent à faire des sons
• avec des sons (bouche, voix, langue, dents…) et des syllabes
• pour parler (aider les copains quand ils se trompent), dire, raconter
• pour lire, écrire (à l’école)
• « Les lettres, ça dit des mots, après on raconte, comme dans les histoires ».
1.1. Statut problématique
Inutile d'insister sur les incertitudes de la linguistique en ce qui concerne ce « segment de
discours» que le sens commun identifie comme étant « un mot ». Dire d'une phrase qu'elle
est formée de 10 mots, ou dire que le texte du Cid, par exemple, en compte 16 690, cela
suppose soit une définition assurée du mot comme unité de texte, telle que jamais celui
qui compte ne puisse hésiter ou ne doive arbitrer de façon subjective, soit une norme
conventionnelle prévoyant tous les cas douteux.
Que l'on songe seulement aux « expressions », aux lexies plus ou moins figées par
l'usage, et qui se présentent au locuteur comme une seule unité : clin d'œil est lexicalisé
au point que clin n'a plus aucune existence propre; on sera tenté d'y voir une seule unité;
fera-t-on de même pour coup d'œil, coup d'État, coup d'essai, coup d'épée ? Où mettre la
limite entre celles des combinaisons qui seront admises pour une unité et celles qui en
vaudront trois ? Et on se posera des questions semblables pour quantité de locutions
grammaticales : au lieu de, au-devant de, afin que, etc. Sur le plan syntaxique, faudra-t-il
traiter il a été vu comme une unité, ou deux (il /a été vu), ou trois (il /a été/vu), ou quatre ?
Et fera-t-on une différence entre au (combat) et à la (guerre), ou bien analysera-t-on au et
les autres formes contractes ?
(Muller C., Langue française, 1969)
Brouillages formels et sémantiques
•
•
•
•
aller, ira, va…
pomme de terre
avec, à…
injustement
approche presque impossible phonologiquement (dans notre langue dépourvue d’accent
démarcatif), trompeuse graphiquement, délicate à cerner sémantiquement
(Pruvost, 1999).
unité préconstruite catégorisable (Riegel, Pellat, Rioul)
Identification formelle du mot
De quoi parle-t-on ?
•
•
•
•
mot-forme / unité lexicale
mot / morphème
mot / lemme
lexique / vocabulaire
Impossible inventaire
introspection / enquêtes / statistiques
Quantifier le vocabulaire d'un texte, c'est (Muller 1969) :
1) le découper en un certain nombre d'unités dites « mots »;
2) regrouper chacun de ces mots sous un vocable, ce qui exige :
a) la séparation des formes homographes appartenant à des vocables distincts (par ex.
dure adj. fém. et dure, forme de verbe);
b) le regroupement des formes hétérographes ou formes fléchies appartenant à un
même vocable (par ex. durer, dure forme verbale, durera, etc.).
1.2. La statistique lexicale
Une bourgeoise qui maraudait dans le coin s'approcha de l'enfant pour lui dire ces mots :
–
Mais voyons, ma petite chérie, tu lui fais du mal à ce pauvre meussieu. Il ne faut pas
brutaliser comme ça les grandes personnes.
–
Grandes personnes mon cul, répliqua Zazie. Il ne veut pas répondre à mes questions.
–
Ce n'est pas une raison valable. La violence, ma petite chérie, doit toujours être évitée dans
les rapports humains. Elle est éminemment condamnable.
–
Condamnable mon cul, répliqua Zazie, je ne vous demande pas l'heure qu'il est.
À
2
Approcha
1
Bourgeoise
1
Brutaliser
1
Ça
1
Ce
2
Ces
1
Chérie
2
Coin
1
Comme
1
Condamnabl 2
e
Cul
2
index
Quelques chiffres :
TLF = 70 000 unités lexicales
Petit Robert = nomenclature = 65 000
tout le théâtre de Corneille = 4000
tout le théâtre de Racine = 3500
Hugo = 20 000
Aragon, Sartre, Colette, Malraux = 10 000
nombre d'hapax (mots de fréquence 1) donne
une indication de la « richesse » lexicale d'un
texte
Les listes de fréquence
TLF : 90 000 000 occurrences de formes pour 70 000 mots distincts (unités lexicales).
Organisation pyramidale :
• les mots très fréquents (fréquence > 7000) représentent environ 90 % du corpus, soit 907
mots
• les mots peu fréquents (entre 500 et 7000) représentent 5800 mots, soit 8% du corpus
• les mots rares, 2% du corpus = + de 64 000 mots (fréquence entre 2 et 500) dont 20000 qui
n'apparaissent qu'une seule fois (= hapax).
En français : mots outils représentent environ 50% de n'importe quel texte (donc à automatiser
pour la lecture, mais pas intéressants pour l'interprétation).
Plus un mot est fréquent, plus il est court, plus un mot est fréquent, plus il peut prendre de sens
différents...
Listes de fréquences / échelles de mots
• Français fondamental
• L'échelle Dubois-Buyse / VOB
• Listes Orthographiques de Base
• EOLE
• NOVLEX
Mots fréquents = mots connus ?
2. Eléments de morphologie lexicale
Domaine qui étudie la formation des mots. Analyse de la structure interne des unités : inventaire,
nature et forme des constituants, contraintes qui pèsent sur leurs possibilités de combinatoire...
mots simples / mots construits : table, tables, tablette, tablettes, tabulaire, attablé, tableau, tabloïde,
dessous de table, étable ? portable ?
Différents procédés de formation : impossible, portatif, photographe, porte-monnaie, important,
cégétiste, portable , photocopillage, prof., parking...
mot / morphème : in-juste-ment, ortho-graphe, sec-able, in-vis-ible...
75% du lexique français est construit
régularités qu’on peut décrire et qui sont susceptibles de devenir des objets d’enseignement
coutelier, pincelier, ciselier, couteleur, africaniste, mondaniste, comportementaliste,
centraliste, festivaliste, systématicien, archivistique, rythmicien...
Plusieurs procédés de création lexicale
Dérivation
création d'une nouvelle unité à partir
d'une « base » (élément qui porte le sens lexical) et
d'un ou plusieurs affixes (“qui est fixé, attaché”)
chant- (chanteur), feuill- (feuillage), buvable- (imbuvable)
une “base” n'est pas un mot : unité constuite par l'analyse
Une base peut être elle-même issue d'une dérivation
buvable > imbuvable, moyenâg-eux...
“radical”, « base » minimale, +/- autonome (« buv- »)
“racine” : forme noyau (abstraite), proche du mot d'origine
reconstruction > reconstruct/ion > re/construct- > con/struct- > -strui- (cf. dé-(s)truire, in-struire, obstruer...), du latin « struere », « empiler, bâtir »
Dérivation avec affixes (préfixes, suffixes)
- pas de valeur dénominative
- « opérateur » qui agit sur le sens de la base
Le sens construit est en partie compositionnel.
Il y a création d'un nouveau mot
Dérivation # flexion (pas création d'un nouveau mot mais variation du même mot selon le
contexte)
maisonnette / maisons
Dérivation sans affixe : Conversion
Création d'une unité lexicale par changement de catégorie grammaticale (sans affixe) :
le vrai et le faux, poubelle... marron (adj),
Les adjectifs de couleurs (bleu, rouge, vert, etc.)
utilisés seuls s'accordent avec le nom qu'ils qualifient
Des pantalons bleus. Des robes vertes
Si l'adjectif est composé, il reste invariable
Des yeux bleu vert
Cette règle est également valable pour les noms (ou les adjectifs) qui précisent la nuance
Des yeux bleu foncé. Des cheveux brun clair. Une veste bleu pétrole...
Les noms de fruits, de pierres précieuses, de fleurs, utilisés pour désigner la couleur restent
invariables
Des cravates orange. Des yeux émeraude
Notez : "pourpre, mauve, rose, écarlate, fauve, incarnat" devenus de véritables adjectifs varient
s'ils sont employés seuls
Il avait les joues écarlates
Site synapse.fr
Des « trous » dans la chaîne dérivationnelle
Il est possible qu'un dérivé théoriquement possible ne soit pas attesté dans le lexique usuel
ou qu'un dérivé existe, mais dont la base n'est pas attestée
>> forme supplétive, dont le sens coïncide exactement avec la forme manquante,
>> périphrases :
tomber > chute
aveugle > cécité (base « supplétive)
manger > le fait de manger (périphrase)
dératiser > *ratiser > rat (formation « parasynthétique »)
Liste des affixes du français
Denizot
Apothéloz
Composition
Association de deux bases (+/- autonomes)
Timbre-poste, dos d'âne, orthographe …
Frontière composition / dérivation
multi, avant, contre...
Frontière entre les deux bases : degré de soudure
Vinaigre, compte-goutte, quelqu'un, chaise longue, mise en scène
Le trait d'union et la soudure sur le site « renouvo »
soudure dans tous les composés de contr(e)- et entr(e)ex. : contrappel, entretemps sur le modèle de contrepoint, entrevue
soudure dans tous les composés de extra-, infra-, intra-, ultraex. : extrafort sur le modèle de extraordinaire, comme les composés de en, sur, supra,
soudés.
mais extra-utérin
déjà
soudure dans les composés d'éléments savants, en particulier en -o
ex. : autoécole sur le modèle de radioactif
mais gréco-romain
soudure dans les composés de formation onomatopéique ou dans des mots d'origine étrangère
ex. : bouiboui, weekend, un apriori sur le modèle de coucou…
soudure dans certains composés formés à l'origine d'un verbe et d'un nom, ou d'un verbe et de -tout,
les composés avec basse-, mille-, haut(e)-, et quelques autres composés
ex. : croquemonsieur, mangetout, millepatte, portemonnaie, rondpoint sur le modèle de faitout,
passeport, portefeuille
N.B. Ces mots étant devenus des mots simples, ils suivent la règle générale du singulier et du
pluriel
ex. : un millepatte, des millepattes sur le modèle de un millefeuille, des millefeuilles
N A : chaise longue, panier percé, dessin animé
A N : rond-point
N Ppé : pain perdu
A A : clair obscur, sourd-muet
N prép N : salle à manger, tenue de soirée
N A prép N : offre publique d'achat
Prép N : en-cas
Pro V : on-dit
N N : bateau mouche, timbre-poste
V N : porte manteau , gratte ciel (V complément)
N V : insectivore (complément V) ; maintenir (tenir avec la main)
N prép V : machine à coudre
V V : un va-et-vient
Composition « savante » : ordre des mots « inversé »
Égyptologue / bateau-mouche
Mot valise (télescopage) : association de deux bases avec recouvrement partiel
photocopillage, franglais, baratartiner, foultitude, clavardage...
Le pluriel des noms composés sur le site « renouvo »
Les noms composés, avec trait d'union, formés à l'origine soit d'une forme verbale et d'un nom, soit
d'une préposition et d'un nom, perçus comme des mots simples, prennent la marque du pluriel au
second élément, seulement et toujours lorsqu'ils sont au pluriel
ex. : un essuie-main, des essuie-mains, un cure-ongle, des cure-ongles, un
garde-meuble,
des garde-meubles - qu'il s'agisse de personnes ou de
choses -, un après-midi, des aprèsmidis
N.B. La règle ne concerne pas les quelques composés dont le second élément contient un article (ex. :
trompe-l'œil) ou commence par une majuscule (ex. : prie-Dieu).
Les noms empruntés à d'autres langues, dont le latin, suivent la règle générale du singulier et du
pluriel des mots français
ex. : les boss, les gentlemans, les matchs, les minimas, les minimums
Exceptions : les noms ayant conservé leur valeur de citation (ex. : des requiem).
abréviation : troncation d'un mot existant, en enlevant le début (aphérèse) ou la fin (apocope)
(auto)car, prof(esseur), clim(atisation), appart(ement)...
siglaison ; réunion de lettres ou syllabes initiales de mots formant un syntagme
VTT, CGT, IUFM...
La prononciation peut être de l'épellation de lettres (IUFM) ou bien le sigle peut se lire comme un mot
(UNESCO, SMIC) – et on parle alors d' « acronyme ».
emprunt ; introduction d'un mot d'une autre langue.
L'emprunt peut être sémantique : « réaliser »
ou formel, avec conservation de la forme d'origine (week-end) ou modification (redingote < riding coat).
Le calque concerne la traduction littérale d'un mot d'une autre langue (gratte ciel < sky-scraper).
Des questions à explorer :
>> limites d'une « famille de mots »
>> contraintes de sélection des affixes et des bases
>> réitération de la suffixation
>> créativité lexicale et lexicographie
>> ordre de présentation des affixes dans la progression ????
3. Eléments de sémantique lexicale
Définir un mot,
c'est le mettre en relation avec une suite d'autres mots
censée dire la même chose que lui (paraphrase du dictionnaire).
La sémantique lexicale cherche à identifier le(s) sens des unités du lexique et à sélectionner celui qui
est activé par les différents contextes dans lesquels elles apparaissent (cf. « rayon » de soleil / de vélo
/ du cercle...).
Les mots ne sont pas des étiquettes du réel
Quand on passe d’une langue à une autre, on découvre que ce ne sont pas les noms des choses
qui changent, ce sont souvent les choses elles-mêmes, ou plutôt la manière de les considérer. Cf.
E. Charmeux
ex. BOIS et FORÊT, / allemand, WALD et HOLZ / espagnol BOSQUE et MADERA
Les mots ne sont pas des unités minimales de sens
« nous courons » / « nous courions »
un seul mot peut donc contenir plusieurs unités de signification ;
« pomme de terre »
composé de trois « mots » mais ne présente qu’une seule unité significative
Sens propre / sens figuré ?
cf. Denizot
J'ai décidé de bannir de mon langage pédagogique les simplifications portées par ce couple plus
scolaire que linguistique : le « pied » de la chaise, le « pied » de l'immeuble, le « pied » des
champignons, c'est ce qui touche par terre. Sens propre ou sens figuré ?
Dénotation et connotation
à côté des significations recensées dans le dictionnaire, des pouvoirs d’évocation qui ne sont pas
cités dans les dictionnaires, et qui semblent bien appartenir à des groupes culturels ou familiaux
le blanc
Sens et signification des mots.
En tant que tel, un mot ne saurait avoir un sens, mais bien une multiplicité de sens possibles,
dépendant des divers contextes où il se trouve. « Quel petit monstre ! »
En réalité, les mots ont des emplois divers, correspondant à des codages sociaux divers, choisis
en fonction de projets divers de communication, et dont on ne peut rendre compte qu’en relation
avec ces projets de communication.
Petit monstre !
Exemples d'analyse sémantique
L'information sémantique portée par le mot est généralement décrite comme un ensemble de
« sèmes » (traits sémantiques), éléments distinctifs.
L'analyse componentielle associe à chaque unité lexicale une « formule », série des traits
sémantiques qui la « définissent » (Pottier 1974) :
Sur terre Sur rail Deux roues individuel payant 4 à 6 pers. intra-urbain Transport de personnes
voiture
+
-
-
taxi
+
-
-
autobu
s
+
-
-
autoca
r
+
-
métro
+
+
+
-
+
+
+
+
+
-
+
-
+
+
-
-
+
-
-
+
-
-
+
-
+
+
MAIS table basse, de salon… de multiplication, de la loi…
discours fleuve
ses dossiers dorment dans un placard
assister qq’un, à qqch…
faire long feu…
tête, citrouille, carafe, cafetière, cigare, caboche…
mousse…
Sous forme d'arborescence
Vs notion de
prototype
Attention : la langue organise le monde – cf. arbitraire du signe et diversité des langues naturelles
Lexicographie
Qu'est-ce qu'un dictionnaire ? Comparaison de différents dictionnaire et spécificités ;
encodage des propriétés lexicales ; description du sens etc.
Le travail de définition sert surtout à donner des catégories : catégories de plantes, d'animaux, de
machines et de procédés de fabrication. Plus ces catégories sont complexes, plus il est facile de
définir : tout le monde donnera sans peine une définition au moins sommaire du mot télescope.
Mais donner une bonne définition du verbe voir est une autre affaire. On arrive, en suivant la route
des définitions, à des terminologies dont il n'est pas question de nier l'utilité pour les spécialistes,
mais auxquelles il n'y a pas lieu de faire une grande place en classe de français.
J. Picoche (1999 et application dans le Dictionnaire du français usuel)
A1 (autrement dit l'actant n°1) est libre .
1.s'il n'existe pas de A2 (ou actant numéro 2) qui force A1 à faire ce qu'il ne voudrait pas faire
ou à ne pas faire ce qu'il voudrait faire,
2. si cet actant A2 existe, mais n'use pas de sa force ".
Les relations lexicales
Paronymie
précepteur / percepteur,
Homonymie
vers, verre… ; pas (nég) / pas ; est (V) / est (N)...
Synonymie
gai / heureux, frapper / battre... MAIS
Les Verts ont battu / *frappé les Bleus
Cette nouvelle les a frappés / *battus
Il est entré sans frapper / * battre
Antonymie
Préfixation : lisible / illisible, faire / défaire...
Opposition lexicale : grand petit
Mots qui s'excluent : vivant / mort
Mots de sens réciproque : acheter / vendre
Extrêmes d'une gradation : grand / petit
Hypéronymie / hyponymie
Relation hiérarchique entre deux mots dont le premier a un
domaine de désignation qui
inclut le domaine de désignation du
second : animal > oiseau > hirondelle
Champ sémantique (polysémie)
Propriété d’un mot / morphème présentant une pluralité de sens opération, canard
Relation de métaphore : les ailes du nez, torrent de paroles...
Relation de métonymie : boire un verre, chercher un toit...
Polysémie / homonymie
Voler 1 : Le corbeau ne vole que le jour
Voler 2 : Il avait volé quelques pommes
Lien sémantique ?
Synonymes / antonymes / dérivés ?
Construction syntaxique ?
Étymologie ?
Champ lexical
ensemble de mots associés à un domaine, un mot clé
cartable, devoir, élève…
Au sens strict, réunit des mots de même catégorie grammaticale, par opposition au « champ
associatif », qui réunit des mots de catégories différentes.
Famille de mots
.
mots formés à partir d'un même radical / racine
terre, terrain, terrestre, atterrir...
lait, lacté
allomorphie
chien / canin... doublets
Ex. famille de SEL
salière, salaison, salade, saucisson, saumure…
Téléchargement