Morphologie et sémantique lexicales Quelques points de repère Lexique / vocabulaire ensemble des unités lexicales d'une langue ensemble ouvert vs ensemble des unités employées dans un corpus ; ensemble fermé Vocabulaire actif / passif 1. Le mot ?! • • • • Les mots nous présentent des choses une petite image claire et usuelle (Proust) va, ira, allons... sont des formes du même mot le mot « parce que » introduit la cause faire un bon mot ; glisser un mot etc. Le mot « mot » est polysémique ! Qu’est-ce qu’un mot ? Pour des élèves de CP : • lettres, espaces, apostrophe, alphabet (il y a des grands et des petits mots) • textes, dictionnaires, livres, albums, documentaires, histoires, journaux… • pour lire (des histoires aux enfants) / écrire (un message au maître) / apprendre (ce que mangent les poissons ; les nouvelles dans le journal) / faire (par ex. la cuisine) • avec des espaces et des lettres qui servent à faire des sons • avec des sons (bouche, voix, langue, dents…) et des syllabes • pour parler (aider les copains quand ils se trompent), dire, raconter • pour lire, écrire (à l’école) • « Les lettres, ça dit des mots, après on raconte, comme dans les histoires ». 1.1. Statut problématique Inutile d'insister sur les incertitudes de la linguistique en ce qui concerne ce « segment de discours» que le sens commun identifie comme étant « un mot ». Dire d'une phrase qu'elle est formée de 10 mots, ou dire que le texte du Cid, par exemple, en compte 16 690, cela suppose soit une définition assurée du mot comme unité de texte, telle que jamais celui qui compte ne puisse hésiter ou ne doive arbitrer de façon subjective, soit une norme conventionnelle prévoyant tous les cas douteux. Que l'on songe seulement aux « expressions », aux lexies plus ou moins figées par l'usage, et qui se présentent au locuteur comme une seule unité : clin d'œil est lexicalisé au point que clin n'a plus aucune existence propre; on sera tenté d'y voir une seule unité; fera-t-on de même pour coup d'œil, coup d'État, coup d'essai, coup d'épée ? Où mettre la limite entre celles des combinaisons qui seront admises pour une unité et celles qui en vaudront trois ? Et on se posera des questions semblables pour quantité de locutions grammaticales : au lieu de, au-devant de, afin que, etc. Sur le plan syntaxique, faudra-t-il traiter il a été vu comme une unité, ou deux (il /a été vu), ou trois (il /a été/vu), ou quatre ? Et fera-t-on une différence entre au (combat) et à la (guerre), ou bien analysera-t-on au et les autres formes contractes ? (Muller C., Langue française, 1969) Brouillages formels et sémantiques • • • • aller, ira, va… pomme de terre avec, à… injustement approche presque impossible phonologiquement (dans notre langue dépourvue d’accent démarcatif), trompeuse graphiquement, délicate à cerner sémantiquement (Pruvost, 1999). unité préconstruite catégorisable (Riegel, Pellat, Rioul) Identification formelle du mot De quoi parle-t-on ? • • • • mot-forme / unité lexicale mot / morphème mot / lemme lexique / vocabulaire Impossible inventaire introspection / enquêtes / statistiques Quantifier le vocabulaire d'un texte, c'est (Muller 1969) : 1) le découper en un certain nombre d'unités dites « mots »; 2) regrouper chacun de ces mots sous un vocable, ce qui exige : a) la séparation des formes homographes appartenant à des vocables distincts (par ex. dure adj. fém. et dure, forme de verbe); b) le regroupement des formes hétérographes ou formes fléchies appartenant à un même vocable (par ex. durer, dure forme verbale, durera, etc.). 1.2. La statistique lexicale Une bourgeoise qui maraudait dans le coin s'approcha de l'enfant pour lui dire ces mots : – Mais voyons, ma petite chérie, tu lui fais du mal à ce pauvre meussieu. Il ne faut pas brutaliser comme ça les grandes personnes. – Grandes personnes mon cul, répliqua Zazie. Il ne veut pas répondre à mes questions. – Ce n'est pas une raison valable. La violence, ma petite chérie, doit toujours être évitée dans les rapports humains. Elle est éminemment condamnable. – Condamnable mon cul, répliqua Zazie, je ne vous demande pas l'heure qu'il est. À 2 Approcha 1 Bourgeoise 1 Brutaliser 1 Ça 1 Ce 2 Ces 1 Chérie 2 Coin 1 Comme 1 Condamnabl 2 e Cul 2 index Quelques chiffres : TLF = 70 000 unités lexicales Petit Robert = nomenclature = 65 000 tout le théâtre de Corneille = 4000 tout le théâtre de Racine = 3500 Hugo = 20 000 Aragon, Sartre, Colette, Malraux = 10 000 nombre d'hapax (mots de fréquence 1) donne une indication de la « richesse » lexicale d'un texte Les listes de fréquence TLF : 90 000 000 occurrences de formes pour 70 000 mots distincts (unités lexicales). Organisation pyramidale : • les mots très fréquents (fréquence > 7000) représentent environ 90 % du corpus, soit 907 mots • les mots peu fréquents (entre 500 et 7000) représentent 5800 mots, soit 8% du corpus • les mots rares, 2% du corpus = + de 64 000 mots (fréquence entre 2 et 500) dont 20000 qui n'apparaissent qu'une seule fois (= hapax). En français : mots outils représentent environ 50% de n'importe quel texte (donc à automatiser pour la lecture, mais pas intéressants pour l'interprétation). Plus un mot est fréquent, plus il est court, plus un mot est fréquent, plus il peut prendre de sens différents... Listes de fréquences / échelles de mots • Français fondamental • L'échelle Dubois-Buyse / VOB • Listes Orthographiques de Base • EOLE • NOVLEX Mots fréquents = mots connus ? 2. Eléments de morphologie lexicale Domaine qui étudie la formation des mots. Analyse de la structure interne des unités : inventaire, nature et forme des constituants, contraintes qui pèsent sur leurs possibilités de combinatoire... mots simples / mots construits : table, tables, tablette, tablettes, tabulaire, attablé, tableau, tabloïde, dessous de table, étable ? portable ? Différents procédés de formation : impossible, portatif, photographe, porte-monnaie, important, cégétiste, portable , photocopillage, prof., parking... mot / morphème : in-juste-ment, ortho-graphe, sec-able, in-vis-ible... 75% du lexique français est construit régularités qu’on peut décrire et qui sont susceptibles de devenir des objets d’enseignement coutelier, pincelier, ciselier, couteleur, africaniste, mondaniste, comportementaliste, centraliste, festivaliste, systématicien, archivistique, rythmicien... Plusieurs procédés de création lexicale Dérivation création d'une nouvelle unité à partir d'une « base » (élément qui porte le sens lexical) et d'un ou plusieurs affixes (“qui est fixé, attaché”) chant- (chanteur), feuill- (feuillage), buvable- (imbuvable) une “base” n'est pas un mot : unité constuite par l'analyse Une base peut être elle-même issue d'une dérivation buvable > imbuvable, moyenâg-eux... “radical”, « base » minimale, +/- autonome (« buv- ») “racine” : forme noyau (abstraite), proche du mot d'origine reconstruction > reconstruct/ion > re/construct- > con/struct- > -strui- (cf. dé-(s)truire, in-struire, obstruer...), du latin « struere », « empiler, bâtir » Dérivation avec affixes (préfixes, suffixes) - pas de valeur dénominative - « opérateur » qui agit sur le sens de la base Le sens construit est en partie compositionnel. Il y a création d'un nouveau mot Dérivation # flexion (pas création d'un nouveau mot mais variation du même mot selon le contexte) maisonnette / maisons Dérivation sans affixe : Conversion Création d'une unité lexicale par changement de catégorie grammaticale (sans affixe) : le vrai et le faux, poubelle... marron (adj), Les adjectifs de couleurs (bleu, rouge, vert, etc.) utilisés seuls s'accordent avec le nom qu'ils qualifient Des pantalons bleus. Des robes vertes Si l'adjectif est composé, il reste invariable Des yeux bleu vert Cette règle est également valable pour les noms (ou les adjectifs) qui précisent la nuance Des yeux bleu foncé. Des cheveux brun clair. Une veste bleu pétrole... Les noms de fruits, de pierres précieuses, de fleurs, utilisés pour désigner la couleur restent invariables Des cravates orange. Des yeux émeraude Notez : "pourpre, mauve, rose, écarlate, fauve, incarnat" devenus de véritables adjectifs varient s'ils sont employés seuls Il avait les joues écarlates Site synapse.fr Des « trous » dans la chaîne dérivationnelle Il est possible qu'un dérivé théoriquement possible ne soit pas attesté dans le lexique usuel ou qu'un dérivé existe, mais dont la base n'est pas attestée >> forme supplétive, dont le sens coïncide exactement avec la forme manquante, >> périphrases : tomber > chute aveugle > cécité (base « supplétive) manger > le fait de manger (périphrase) dératiser > *ratiser > rat (formation « parasynthétique ») Liste des affixes du français Denizot Apothéloz Composition Association de deux bases (+/- autonomes) Timbre-poste, dos d'âne, orthographe … Frontière composition / dérivation multi, avant, contre... Frontière entre les deux bases : degré de soudure Vinaigre, compte-goutte, quelqu'un, chaise longue, mise en scène Le trait d'union et la soudure sur le site « renouvo » soudure dans tous les composés de contr(e)- et entr(e)ex. : contrappel, entretemps sur le modèle de contrepoint, entrevue soudure dans tous les composés de extra-, infra-, intra-, ultraex. : extrafort sur le modèle de extraordinaire, comme les composés de en, sur, supra, soudés. mais extra-utérin déjà soudure dans les composés d'éléments savants, en particulier en -o ex. : autoécole sur le modèle de radioactif mais gréco-romain soudure dans les composés de formation onomatopéique ou dans des mots d'origine étrangère ex. : bouiboui, weekend, un apriori sur le modèle de coucou… soudure dans certains composés formés à l'origine d'un verbe et d'un nom, ou d'un verbe et de -tout, les composés avec basse-, mille-, haut(e)-, et quelques autres composés ex. : croquemonsieur, mangetout, millepatte, portemonnaie, rondpoint sur le modèle de faitout, passeport, portefeuille N.B. Ces mots étant devenus des mots simples, ils suivent la règle générale du singulier et du pluriel ex. : un millepatte, des millepattes sur le modèle de un millefeuille, des millefeuilles N A : chaise longue, panier percé, dessin animé A N : rond-point N Ppé : pain perdu A A : clair obscur, sourd-muet N prép N : salle à manger, tenue de soirée N A prép N : offre publique d'achat Prép N : en-cas Pro V : on-dit N N : bateau mouche, timbre-poste V N : porte manteau , gratte ciel (V complément) N V : insectivore (complément V) ; maintenir (tenir avec la main) N prép V : machine à coudre V V : un va-et-vient Composition « savante » : ordre des mots « inversé » Égyptologue / bateau-mouche Mot valise (télescopage) : association de deux bases avec recouvrement partiel photocopillage, franglais, baratartiner, foultitude, clavardage... Le pluriel des noms composés sur le site « renouvo » Les noms composés, avec trait d'union, formés à l'origine soit d'une forme verbale et d'un nom, soit d'une préposition et d'un nom, perçus comme des mots simples, prennent la marque du pluriel au second élément, seulement et toujours lorsqu'ils sont au pluriel ex. : un essuie-main, des essuie-mains, un cure-ongle, des cure-ongles, un garde-meuble, des garde-meubles - qu'il s'agisse de personnes ou de choses -, un après-midi, des aprèsmidis N.B. La règle ne concerne pas les quelques composés dont le second élément contient un article (ex. : trompe-l'œil) ou commence par une majuscule (ex. : prie-Dieu). Les noms empruntés à d'autres langues, dont le latin, suivent la règle générale du singulier et du pluriel des mots français ex. : les boss, les gentlemans, les matchs, les minimas, les minimums Exceptions : les noms ayant conservé leur valeur de citation (ex. : des requiem). abréviation : troncation d'un mot existant, en enlevant le début (aphérèse) ou la fin (apocope) (auto)car, prof(esseur), clim(atisation), appart(ement)... siglaison ; réunion de lettres ou syllabes initiales de mots formant un syntagme VTT, CGT, IUFM... La prononciation peut être de l'épellation de lettres (IUFM) ou bien le sigle peut se lire comme un mot (UNESCO, SMIC) – et on parle alors d' « acronyme ». emprunt ; introduction d'un mot d'une autre langue. L'emprunt peut être sémantique : « réaliser » ou formel, avec conservation de la forme d'origine (week-end) ou modification (redingote < riding coat). Le calque concerne la traduction littérale d'un mot d'une autre langue (gratte ciel < sky-scraper). Des questions à explorer : >> limites d'une « famille de mots » >> contraintes de sélection des affixes et des bases >> réitération de la suffixation >> créativité lexicale et lexicographie >> ordre de présentation des affixes dans la progression ???? 3. Eléments de sémantique lexicale Définir un mot, c'est le mettre en relation avec une suite d'autres mots censée dire la même chose que lui (paraphrase du dictionnaire). La sémantique lexicale cherche à identifier le(s) sens des unités du lexique et à sélectionner celui qui est activé par les différents contextes dans lesquels elles apparaissent (cf. « rayon » de soleil / de vélo / du cercle...). Les mots ne sont pas des étiquettes du réel Quand on passe d’une langue à une autre, on découvre que ce ne sont pas les noms des choses qui changent, ce sont souvent les choses elles-mêmes, ou plutôt la manière de les considérer. Cf. E. Charmeux ex. BOIS et FORÊT, / allemand, WALD et HOLZ / espagnol BOSQUE et MADERA Les mots ne sont pas des unités minimales de sens « nous courons » / « nous courions » un seul mot peut donc contenir plusieurs unités de signification ; « pomme de terre » composé de trois « mots » mais ne présente qu’une seule unité significative Sens propre / sens figuré ? cf. Denizot J'ai décidé de bannir de mon langage pédagogique les simplifications portées par ce couple plus scolaire que linguistique : le « pied » de la chaise, le « pied » de l'immeuble, le « pied » des champignons, c'est ce qui touche par terre. Sens propre ou sens figuré ? Dénotation et connotation à côté des significations recensées dans le dictionnaire, des pouvoirs d’évocation qui ne sont pas cités dans les dictionnaires, et qui semblent bien appartenir à des groupes culturels ou familiaux le blanc Sens et signification des mots. En tant que tel, un mot ne saurait avoir un sens, mais bien une multiplicité de sens possibles, dépendant des divers contextes où il se trouve. « Quel petit monstre ! » En réalité, les mots ont des emplois divers, correspondant à des codages sociaux divers, choisis en fonction de projets divers de communication, et dont on ne peut rendre compte qu’en relation avec ces projets de communication. Petit monstre ! Exemples d'analyse sémantique L'information sémantique portée par le mot est généralement décrite comme un ensemble de « sèmes » (traits sémantiques), éléments distinctifs. L'analyse componentielle associe à chaque unité lexicale une « formule », série des traits sémantiques qui la « définissent » (Pottier 1974) : Sur terre Sur rail Deux roues individuel payant 4 à 6 pers. intra-urbain Transport de personnes voiture + - - taxi + - - autobu s + - - autoca r + - métro + + + - + + + + + - + - + + - - + - - + - - + - + + MAIS table basse, de salon… de multiplication, de la loi… discours fleuve ses dossiers dorment dans un placard assister qq’un, à qqch… faire long feu… tête, citrouille, carafe, cafetière, cigare, caboche… mousse… Sous forme d'arborescence Vs notion de prototype Attention : la langue organise le monde – cf. arbitraire du signe et diversité des langues naturelles Lexicographie Qu'est-ce qu'un dictionnaire ? Comparaison de différents dictionnaire et spécificités ; encodage des propriétés lexicales ; description du sens etc. Le travail de définition sert surtout à donner des catégories : catégories de plantes, d'animaux, de machines et de procédés de fabrication. Plus ces catégories sont complexes, plus il est facile de définir : tout le monde donnera sans peine une définition au moins sommaire du mot télescope. Mais donner une bonne définition du verbe voir est une autre affaire. On arrive, en suivant la route des définitions, à des terminologies dont il n'est pas question de nier l'utilité pour les spécialistes, mais auxquelles il n'y a pas lieu de faire une grande place en classe de français. J. Picoche (1999 et application dans le Dictionnaire du français usuel) A1 (autrement dit l'actant n°1) est libre . 1.s'il n'existe pas de A2 (ou actant numéro 2) qui force A1 à faire ce qu'il ne voudrait pas faire ou à ne pas faire ce qu'il voudrait faire, 2. si cet actant A2 existe, mais n'use pas de sa force ". Les relations lexicales Paronymie précepteur / percepteur, Homonymie vers, verre… ; pas (nég) / pas ; est (V) / est (N)... Synonymie gai / heureux, frapper / battre... MAIS Les Verts ont battu / *frappé les Bleus Cette nouvelle les a frappés / *battus Il est entré sans frapper / * battre Antonymie Préfixation : lisible / illisible, faire / défaire... Opposition lexicale : grand petit Mots qui s'excluent : vivant / mort Mots de sens réciproque : acheter / vendre Extrêmes d'une gradation : grand / petit Hypéronymie / hyponymie Relation hiérarchique entre deux mots dont le premier a un domaine de désignation qui inclut le domaine de désignation du second : animal > oiseau > hirondelle Champ sémantique (polysémie) Propriété d’un mot / morphème présentant une pluralité de sens opération, canard Relation de métaphore : les ailes du nez, torrent de paroles... Relation de métonymie : boire un verre, chercher un toit... Polysémie / homonymie Voler 1 : Le corbeau ne vole que le jour Voler 2 : Il avait volé quelques pommes Lien sémantique ? Synonymes / antonymes / dérivés ? Construction syntaxique ? Étymologie ? Champ lexical ensemble de mots associés à un domaine, un mot clé cartable, devoir, élève… Au sens strict, réunit des mots de même catégorie grammaticale, par opposition au « champ associatif », qui réunit des mots de catégories différentes. Famille de mots . mots formés à partir d'un même radical / racine terre, terrain, terrestre, atterrir... lait, lacté allomorphie chien / canin... doublets Ex. famille de SEL salière, salaison, salade, saucisson, saumure…