La formalisation du vocabulaire latin problèmes de méthode Ghislaine VIRÉ Le sujet que je me propose de traiter ne correspond peutMêtre pas exactement au thème qui a été retenu pour ce colloque, à savoir "Le nombre et le texte. Méthodes quantitatives dans les études littéraires et linguistiques". En effet, mon propos vise à identifier les problèmes que pose la structuration du vocabulaire latin dans la perspective d'un traitement automatisé et, dans un second temps, à concevoir les solutions susceptibles de résoudre ces difficultés. C'est dire que mon travail se situe en amont de l'ordinateur, plus précisément à ce stade de la recherche - délicat, mais passionnant entre tous - qui touche à l'analyse du problème. La plupart des réflexions que je vais vous proposer relèvent donc du domaine méthodologique, le domaine - faut-il encore le rappeler? - dans lequel l'utilisation de l'ordinateur suscite souvent des remises en question novatrices des vues traditionnelles attachées à nos disciplines. Ceci dit, je m'en voudrais de taire la principale raison de ma présence à Liège: j'ai tenu à m'associer à l'hommage amical rendu à Étienne Évrard à l'occasion de ce colloque et saisir l'occasion qui m'était offerte de le remercier pour l'accueil qu'il m'a réservé, il y a plus de quinze ans, au certificat d'études complémentaires en analyse linguistique par ordinateur du L.A.S.L.A. et pour l'intérêt qu'il a toujours témoigné aux travaux que nous effectuons au G.I.T.A., tant dans le domaine de l'E.A.O. que dans le traitement automatisé des textes. * * * Les travaux que j'ai entrepris dans le domaine du vocabulaire se situent daus le cadre plus large de l'expérimentatioll, au niveau du latin, du système d'enseignement assisté par ordinateur implanté à l'V.L.B. (le système PLATO). Au-delà, ou plutôt en deçà de l'élaboration de didacticiels - essentiellement centrés sur des exercices d'entraînement aux automatismes linguistiques - Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. 346 GHISLAINE VJRÉ notre objectif général consiste à dégager d'un certain nombre de matières grammaticales du latin les structures profondes permettant de les formaliser et, si possible, d'en tirer des algorithmes de résolution de problème. Je tiens à préciser d'emblée que par structures profondes d'une matière j'entends l'organisation logique qui sous-tend l'ensemble de cette matière et s'enracine dans l'histoire de la langue. Si, dans le domaine de la morphologie, celle du verbe surtout, il est possible de parvenir à une structuration parfaite, fondée sur un schéma général!, pour le vocabulaire, le problème se pose en termes tout différents, ne fût-ce que parce que l'ensemble des données sur lesquelles on travaille est beaucoup plus difficile à cerner que dans le cas de la conjugaison où on part d'un nombre fini de formes. Pour définir les limites de mes recherches, je préciserai tout d'abord que mon travail n'a ni l'ambition, ni la prétention d'embrasser la totalité du vocabulaire latin. Pour des raisons d'ordre matériel et aussi parce que le but que je poursuis est de nature pédagogique, le point de départ de mes dépouillements est le lexique de base pnblié par mes collègues J.-H. Michel et M. Gester 2 , qui regroupe les qnelque 3500 mots les pIns fréquenunent utilisé par les anteurs figurant au programme de l'enseignement secondaire belge. Il va sans dire que la notion de fréquence, quelle qu'en soit par ailleurs l'utilité pour l'acquisition d'un vocabulaire élémentaire, aboutit souvent à tronquer les familles de mots et à faire disparaître une partie de la richesse lexicale d'une langue. Force m'a donc été de sélectionner encore d'autres mots, qui tous appartiennent à la langue de l'époque classiqne et à celle de débnt de l'Empire et, pour ce faire, j'ai en recours au dictionnaire d'Ernout et Meillet 3 et au dictionnaire publié par le L.A.S.L.A.4 j à ce propos je tiens à remercier mon collègue J. Denooz qui a eu la gentillesse de me faire parvenir les listings complémentaires qui m'ont permis d'affiner mes dépouillements. * * * La première structuration à laquelle on songe tout naturellement lorsqu'il s'agit de traiter le vocabulaire est évidemment celle qui repose sur les familles de mots (c'est-à-dire les familles fondées sur l'étymologie); non seulement c'est la 1 Gh. VIRÉ, Une expérience d'enseignement assisté par ordinateur: la conjugaison latine, Grec et Latin en 1981, Bruxelles, 1981 , pp. 93-105. 2 J.-H. MICHEL et M. GESTER, Lexique de base du latin, Anvers, 1967. A. ERNOUT et A. MEILLET, Dictionnaire étymologique de la langue latine. Histoire des mots, 4e édition, Paris, 1967. 3 4 Dictionnaire et index inverus de la langue latine, Liège, 1981. Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. 347 LA FORMALISATION DU VOCABULAIRE LATIN présentation adoptée de plus en plus souvent dans les manuels de référence 1 mais c'est aussi un schéma qui semble , à première vue , correspondre parfaitement à une des structures non linéaires les plus utilisées en informatique: je veux parler de l'arbre. Est-il nécessaire de rappeler que l'arbre est conçu comme un ensemble fini d'éléments répartis entre la racine A et les sous-arbres qui y sont directement rattachés B, C, D, chacun de ceux-ci pouvant, à son tour, servir de racine à de nouveaux sous-arbres E,F,G, ... niveau 0 niveau 1 E niveau 2 F H J niveau 3 Figure 1 L'arbre pris au sells mathématique du terme se distingue donc de l'arbre généalogique dans la mesure où les mariages entre cousins, même éloignés, sont exclus. Généralement la racine est définie comme étant de niveau zéro et tout sous-arbre est de niveau égal à la racine à laquelle il se rattache, augmentée d'une unité. S'appliquant parfaitement à toute classification logiquement ordonnée, la structure arborescente devrait pouvoir s'adapter aussi aux: familles de mots du latin. On peut, en effet, poser comme hypothèse de travail qu'il devrait être possible de concevoir un schéma théorique en forme d'arbre qui reprendrait l'ensemble des potentialités du lexique latin, étant bien entendu que, pour chaque famille, ne seraient effectivement occupées que les cases correspondant aux mots attestés dans la tradition littéraire. Si cette hypothèse s'avérait fondée, il devrait être possible, dans la perspective d'un traitement automatisé, d'attribuer à chaque mot un numéro d'ordre qui tienne compte tout à la fois de sa catégorie grammaticale et du niveau auquel il se situe par rapport au mot simple pris pour racine de l'arbre. En guise d'illustration, je citerai le code que nous avions prévu d'utiliser, en l'appliquant 1 pour plus de facilité, à une partie seulement de la famille de ire. Toute codification est arbitraire, chaque utilisateur décidant des éléments qu'il souhaite privilégier dans le classement j on peut donc également ramener Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. 348 GHISLAINE VIRÉ 56.00.00.00 niveau 0 56.54.00.00 niveau 1 56.54.13.00 56.54.15.00 1 niveau 2 ambitus niveau 3 56.54.13.21 Figure 2 1er chiffre: catégorie grammaticale (1 subst. j 2 :;:: adj. i 3 nom de nombre i 4 :;:: adj. pron. i 5 = verbe i 6 adv. j 7 = prép.) 2e chiffre: sous-catégorie grammaticale Par ex. 51 le canj.} 52 2e canj., 53 3e canj., 54 4e canj., 55 = 4e canj. bis. 56 v. remarquables. = = = = = = le code grammatical à un seul chiffre et ajouter uu code indiquant s'il s'agit d'un dérivé ou d'un composé. Pour séduisante qu'elle soit, à première vue, cette structuration n'est cependant pas entièrement satisfaisante dans tous les cas. Ainsi, les mots qui se rattachent à une même racine sans avoir de lien direct les uns avec les autres ne trouvent-ils pas aisément place au sein de l'arbre, la seule solution scientifiquement acceptable consistant à les considérer chacun comme mot simple, ce qui revient à multiplier les schémas, donc à atomiser les structures. Le cas des mots issus de la racine *lfic-j*Hic- est exemplaire à cet égard: lux, lumen, Luna, lustrare, luculentus... n'ayant guère de dérivés ou de composés constituent les racines d'arbres souvent squelettiquesj en revanche, le cas de sisto, sto et *-stano (ce dernier attesté seulement en composition) est plus favorable) dans la mesure où de sisto et de sto sont issus des mots nouveaux. La systématisation du vocabulaire débouche rapidement sur des cas limites que le philologue se voit contraint de trancher) sans que les données actuelles de la lexicographie latine lui en donnent toujours les moyens. Ainsi) comment situer) l'un par rapport à l'autre, les trois mots iudex, iudicare et iudicium? S'il est certain que iudicare est le dérivé direct de iudex, iudicium doit-il être considéré comme un substantif de formation parallèle au verbe ou comme le dérivé de celui-ci) bâti sur le même schéma que gaudium à partir de gaudere? Pour ma part, j 'incline à placer iudicare et iudicium au même niveau) ne fûtce que parce que les témoignages parallèles ne fournissent aucun critère de choix (d'une part, il y a très peu de substantifs en -ium dérivés de verbes de la première conjugaison - fiagitium, opprobr-ium, suspirium - j d'autre part, Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. LA FORJ,fALISATION DU VOCABULAIRE LATIN 349 dans le cas de arbiter, on met généralement sur le même plan arbitrari et arbitrium) . o 1 2 3 Figure 3 Famille de decet o 1 2 3 Figure 4 Famille de aequus A ces difficultés, somme toute surmontables moyennant l'intervention du philologue, s'en ajoutent d'autre, plus fondamentales, qui remettent en question l'adéquation même de la structure arborescente à la formalisation du vocabulaire. Quand on adopte un schéma théorique, il est indispensable, en bonne méthode, d'examiner la façon dont se distribuent les cases vides, autrement dit les modalités selon lesquelles le schéma se réalise effectivement dans chaque cas. Or, si l'on a la curiosité de comparer les structures de plusieurs familles, que celles-ci remontent à un mot simple de même nature grammaticale ou pas, on est frappé de constater combien ces schémas diflèrent les uns des autres i je n'en veux pour preuve que les trois structures suivantes qui visualisent les familles de decet, videre et aequas (voir figures 3 à 5). On doit en conclure que le schéma théorique en forme d'arbre n'a pas vraiment de portée générale Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. Figure 5 Famille de videre '" 'g" Z ~ "> ~ '"o in'ViseTe re'Visere videre Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. 351 LA FORMALISATION DU VOCABULAIRE LATIN et a fortiori qu'il ne traduit pas les structures profondes de la langue, telles que je les ai défiuies au début de mon exposé. S'il peut paraître normal d'admettre que tous les sous-arbres théoriques ne soient pas réellement occupés dans chaque famille, il est exclu, en revanche, d'accepter la présence de cases vides entre une racine de niveau 0 et un sousarbre de uiveau 2 par exemple: niveau 0 niveau 1 niveau 2 Figure 6 Or, il faut bien reconnaître que nombre de mots latins obéissent au schéma qui vient d'être tracé, dans la mesure où ils dérivent d'un mot qui n'est pas attesté (seditio par rapport à ire par exemple) ou dont on ne peut affirmer sans risque d'erreur d'où ils sont issus: où situer periurus, où situer iniurus, mot relativement rare, mais à l'origine de iniuria, beaucoup plus souvent utilisés? Autre exemple, autre difficulté: que faire de verbes tels que aedificare, sacrificare, significare ou testificari, tous attestés à date ancienne (c'est-à-dire avant 100 A.C.)6, alors que le substantif ou l'adjectif dont ils pourraient être le dénominatif n'apparaît que postérieurement? Encore faut-il s'interroger sur la question de savoir si pareille filiation est correcte. En effet, l'étude des verbes en -fica1'e attestés à travers toute la latinité a montré que, si, pour la forme, ces verbes semblent devoir être mis en relation avec des composés nominaux, il ne paraissent pas, pour la plupart, dériver de composés connus en -Jex ou en ficus. D'autre part, même si l'on ne doit guère s'étonner de ce que les verbes en -ficare soient plus nombreux que les composés en -fex ou en -ficus, il est troublant de constater que, à certains de ces noms bien attestés dans la langue, comme apiJex, ne correspondent pas de formes verbales. A cela s'ajoutent encore les indications chronologiques qui font apparaître que, même quand nom et verbe coexistent, le second ne dérive pas nécessairement du premier, soit que le nom fût tombé en désuétude au moment où le verbe s'est formé, soit que le nom fût postérieur au verbe. La multiplication des verbes en -ficare s'explique vraisemblablement par le fait que, grâce à ce procédé, la langue se trouvait dotée d'une formation spécifiquement factitive et, dès lors, on se trouve en présence d'une originalité propre au latin qui consiste à approprier au verbe certains 5 6 A. ERNOUT et A. MEILLET, op. cit., p. 329. X. MIGNOT, Les verbes dénominatifs latins, Paris, 1969, p. 352. Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. 352 GHISLAINE VIRÉ traits de la composition nominale et à utiliser comme suffixe verbal un élément qui conserve en partie sa parenté avec un mot de sens plein 7 • Dans ce cas, ou ne peut parler de dénominatif à suffixe complexe, pas plus qu'on ne peut supposer un hypothétique nom àl'origine du verbe. La question de méthode qui se pose est double: cl 'uue part, comment situer un mot comme sacrificare dans l'arbre schématisant la famille de sacer? D'autre part, faut-il également faire figurer ce mot dans la famille de fa cere, et, si oui, de quelle façon faut-il l'y insérer? Un autre exemple confirme, si besoin en est encore, les difficultés méthodologiques que crée l'utilisation de l'arbre mathématique: je l'emprunte, lui aussi, à la catégorie des dénominatifs, l'une des formations les plus productives du latin. Si 1'011 veut classer des verbes comme irasci ou mitescere (attestés dès 100 A.C.), on ne peut que les mettre en relation directe avec ira et mitis s . L'étude approfondie des verbes eu -sclre a permis de montrer que la filiation normale était celle qui, partant d'un thème nominal, donnait naissance à un verbe dénominatif qui, à son tour, servait de base à un déverbatif en -scel'e exprimant le développement progressif de l'action. Il s'agit donc, une fois encore, d'une innovation du latin qui a repris le morphème -sc- servant à former un verbe à partir d'un verbe, pour l'utiliser avec des thèmes nominaux et étendre ainsi considérablement son aire d'extension 9 • Simplement on ignore, dans un certain nombre de cas, si le verbe en sefre a été bâti directement sur le substantif ou sur l'adjectif ou si, au contraire, l'évolution normale s'est produite, le mot intermédiaire - c'est-à-dire le dénominatif - n'étant plus attesté. Pour en revenir à la structure arborescente qui nous occupe, faut-il situer ces verbes en -seere (ou en -sei) au même niveau que les dénominatifs de formation régulière et si, en bonne méthode, on estime inacceptable de supposer l'existence de mots dont la tradition ne conserve pas la trace et qu'on doive, dès lors, mettre tous le dénominatif sur le même plan, quel que soit le suffixe utilisé, le schéma est-il encore parfaitement cohérent? Le problème qui vient d'être posé dépasse d'ailleurs largement le cadre de l'innovation propre au latin qui vient d'être évoquée à propos du cas particulier des dénominatifs j il concerne, en réalité, toutes les formations analogiques, à propos desquelles on doit se demander s'il faut leur octroyer la même place qu'aux formations régulières dont elles s'inspirent. Autrement dit, eommunieare, dénominatif de communis bâti non pas directement sur le thème de l'adjectif, mais à l'aide du suffixe complexe -ica- IO est-il en tous points 7 Ibid., pp. 356-361. 8 Ibid., p. 150. 9 Ibid., pp. 227-228. 10 Ibid., pp. 324-326. Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. 353 LA FORMALISATION DU VOCABULAIRE LATIN comparable aux dénominatifs de la première conjugaison du type curare ou iudicare, tirés en droite ligne du substantif? De même, l'adjectif meticulosus qui emprunte toute la finale de pericu/osus doit-il être considéré comme l'adjectif d'abondance (suffixe -osus) dérivé de metus, alors que sa formation s'explique par le rapprochement de sens qui s'est produit entre les notions toutes proches de crainte et de danger 11 ? La conclusion s'impose, me semble-t-il, que le rapprochement que l'on est tenté de faire entre les familles de mots et la structure arborescente au sens mathématique du terme s'avère totalement inopérant dans la perspective de la formalisation. Et sur ce point, je rejoins la réflexion que notre collègue G. Serbat a faite dans un tout autre contextej s'attachant à étudier les substantifs latins formés à l'aide du suffixe -bu/um, il fait très justement remarquer qu'il ne suffit pas de juxtaposer un mot terminé par ce suffixe et un autre mot, nom ou verbe, de même radical pour rendre compte de la structure du substantif et il insiste sur le fait qu'il faut vérifier que les liens qu'on établit entre les deux mots constituent bien une relation de dépendance 12 • Telle est exactement la question qui se pose lorsqu'il s'agit de structurer le vocabulaire latin par familles de mots, mais sans qu'il soit possible d'y apporter une réponse assurée dans chaque cas. * * * Un second type de structuration, fondé sur les procédés de formation des mots, m'a semblé requérir un examen attentif, dans la mesure où, ne visant plus à établir des liens verticaux entre les mots, mais définissant des axes horizontaux au sein du lexique, il fait disparaître la notion de uiveau de dérivation à l'origine des difficultés insurmontables que je viens de mentionner. il va sans dire que la liste des procédés de formation des mots ne peut être délimitée une fois pour toutes dès le départ et, de ce fait, la structure doit se présenter sous la forme d'un système ouvert de classement plutôt que d'obéir à un schéma théorique général, comme c'était le cas pour les familles de mots. L'objection qui surgit immédiatement porte sur le point de savoir s'il s'agit d'une structuration suffisamment élaborée, justiciable d'un traitement automatisé. La réponse me semble pouvoir être positive à la double condition que la classification des procédés de la dérivation et de la composition soit suffisamment affinée et se double de la mise en évidence des séries de mots les plus productives dont la langue porte le témoignage. C'est donc vers l'analyse des différentes facettes 11 A. ERNOUT, Les adjectifs latins en -6sus et en -ulel1tu~, Paris, 1949, p. 85. 12 G. SERBAT, Les dérivés nominaux latin~ à suf/i:te média tif, Paris, 1975, p. 18. Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. 354 GHISLAINE VIRÉ de cette structuration que mes recherches se sont orientées après le rejet du schéma en forme d'arbre. Qui dit formalisation fondée sur les procédés de formation des mots dit nécessairement hiérarchie des critères de classement, ces derniers ne pouvant pas être identiques pour les dérivés et pour les composés. Dans le premier cas, la prééminence doit être réservée à la nature grammaticale du mot de départ et à celle du mot dérivé, le suffixe n'intervenant qu'ensuite. En ce qui concerne les composés, le critère principal me semble devoir être la nature grammaticale du composé, la nature des éléments qui le constituent et les relations qui les unissent constituant les deuxième et troisième niveaux d'analyse; à ce propos il faut utiliser avec prudence les notions de progressivité et de régressivité proposées par certains pour les composés nominaux 13 , étant donné que, dans un certain nombre de cas, les multiples sens d'un composé ne permettent pas de le classer dans une catégorie plutôt que dans une autre. C'est bien évidemment au niveau de la délimitation des suffixes que gît la difficulté. En l'absence de toute étude d'ensemble portant sur la dérivation, on est forcé de se référer aux quelques ouvrages publiés sur tel ou tel type de formation qui offrent le grand avantage d 'être fondés sur des dépouillements exhaustifs et de réactualiser les indications quelquefois vieillies du dictionnaire d'Ernout et Meillet. Bien que conçus dans une optique toute différente de la mienne, ces travaux mettent en évidence trois principes méthodologiques essentiels auxquels je ne puis que souscrire 14 : tout d'abord, la nécessité de concilier perspective synchronique et diachronique, la première aidant à définir la valeur d'un suffixe donné par opposition aux autres valeurs du système dans lequel il se place, la seconde faisant appel aux groupements sémantiques à l'origine de nouvelles dérivations; en second lieu, il importe de tenir compte de la date d'apparition dans les textes des mots porteurs d'un même suffixe, quelles que soient les difficultés auxquelles se heurte ce type de recherche. Enfin, il convient de distinguer les mots de structure claire pour la conscience linguistique du locuteur de ceux dans lesquels, la base n'étant plus nettement identifiable, la valeur sémantique unissant le suffixe au thème ne peut être établie directement par celui qui parle. Pour répondre aux exigences qui viennent d'être définies, les suffixes doivent se distribuer sur deux axes, le premier qui va de la formation régulière à la formation complexe ne passant par la formation analogique, le second qui 13 Fr. BADER, La formation des composés nominaux du latin, Paris, 1962. 14 Je pense notamment aux ouvrages suivants: X. MIGNOT, op. cit. i J. PERROT, Les dérivés latin.s en ·men et ~mentum, Paris, 1961 i H. QUELLET, Les dérivés latin..s en -or, Paris, 1969j G. SERBAT, op. cit. Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. LA FORMALISATION DU VOCABULAIRE LATIN 355 prend en compte l'époque à laquelle le mot est attesté pour la première fois dans la languej sur ce dernier point, on peut s'inspirer de la chronologie en six ou hlùt périodes - proposée par J. Perrot 15 et reprise par X. Mignot, H. Quellet et G. Serbat 1". Pour justifier l'ordre de présentation des suffixes sur le premier axe, je voudrais citer trois cas qui me semblent exemplaires: les formes différentes sous lesquelles apparaissent en latin les quatre suffixes indo-européens dits instrumentaux, mais auxquels G. Serbat préfère donner le qualificatif de médiatifs, - je veux parler des suffixes latins -bulum, -brum, -cu/um, -crum et -trum - doivent être suivies de la mention de la forme élargie -aculum dont le développement a accompagné l'expansion des verbes de la première conjugaison et qui a ainsi contribué à conserver au suffixe -culum une vitalité consta~te et une structure identique tout au long de la latinitp1. De la même façon, les suffixes -men et -mentum, qui ont l'un et l'autre servi à former nombre de substantifs du vocabulaire courant, ont évolué différemment, notamment parce que le suffixe -mentum s'étant lié à date relativement ancienne à des thèmes en -a- a connu, sous la forme -amentum, un développement parallèle à celui des verbes de la première conjugaison 1S. Si l'on veut être précis, en plus des formes -men, -mentum et -amentum, doivent encore être repris, sous la "même rubrique, les suffixes complexes et apparentés -monium, -monia et -mnus dont l'aire d'extension est beaucoup plus limitée 19 • Comme troisième et dernier exemple, je citerai le cas du suffixe -osus utilisé pour former des adjectifs à partir de substantifs: à côté de la forme -osus doivent en apparaître deux autres, celle déjà mentionnée précédemment -cu/osus, qui explique la formation analogique de meticulosus, et la forme -uosus, attestée dans les mots de type aestuosus et passée ensuite à d'autre mots où la présence du -u ne se justifiait pas (voluptuosus par exemple); il est amusaut de noter à ce propos que le français a repris ce même suffixe pour former des mots comme "délictueux", bâti directement sur delictum, l'adjectif en -uosus n'étant pas attesté 20 ! C'est au travers de subdivisions semblables à celles que je viens d'esquisser, qui tiennent compte de la mouvance de certaines formations au fil des siècles, qu'on a des chances, me semble-t-il, d'atteindre les structures profondes enracinées dans la langue. Il va de soi que les données de la sémantique, rebelles plus 15 J. PERROT, 16 X. MIGNOT, 17 G. SERBAT, op. cit, p. 33. op. op. cit, p. 125. J. 19 Ibid., pp. 28-29. 20 A. ERNOUT, Hi H. QUELLET, op. cit., p. 32i G. SERBAT, op. cît., p. 12. op. cit., p. 133 et pp. 175-177. 18 PERROT, dt., p. op. cit. (Les adieetifs), p. 84. Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. 356 GHISLAINE VIRÉ que toutes autres à la formalisation, n'ont d'autre rôle à jouer dans la recherche des structures que de faire mieux saisir les oppositions qui se manifestent entre sufflxesj ainsi constate-t-on que les substantifs en -or (-oris) dérivés de verbes expriment très souvent des états de durée relativement limitée, engendrant l'agitation de l'individu et le mettant dans l'impossibilité de réagir 2 ' , alors que d'autres substantifs, tirés d'adjectifs et formés à l'aide des suffixes -ia/-itia ou -tas (-tatisJ, marquent davantage des états ou des sentiments permanents: il me suffit, pour illustrer cette constatation, de citer Jurar et insania ou encore umor et caritas. fi me reste, pour terminer, à aborder le problème des séries les plus productives du latin et à réintroduire ainsi, dans les limites du raisonnable, la notion de niveau de dérivation et/ou de composition. Il est vain) me semblet-il, de vouloir s'attacher à la forme extérieure des dérivés et des composés, des mots de même nature grammaticale et, qui plus est, pourvus du même suffixe pouvant obéir à des schémas différents: ainsi) inimicitia, dérivé de l'adjectif inimicus, lui-même composé de amicus, l'adjectif tiré du verbe amare, auquel on peut opposer invidia, le substantif correspondant à l'adjectif invidus, tiré du verbe invidere) composé du simple videre. Mieu~ vaut, dès lors, partir de la structure grammaticale du dérivé ou du composé et analyser les formations successives auxquelles il remonte, tout en sachant que cette démarche ne peut porter ses fruits que pour les mots séparés du mot simple par un ou deux niveaux de dérivation et/ou de composition) étant donné que les mots qui sont davantage éloignés du mot simple ne sont pas suffisamment nombreux dans la langue classique pour que des conclusions significatives puissent se dégager. Sans vouloir entrer dans le détail, je dirai que, sur la base du dépouillemeut du lexique de base) il apparaît qu'un verbe situé au niveau deux par rapport au mot simple auquel il se rattache sera, dans la majorité des cas, un composé cl 'un dénominatif (admirar-i composé de mirari, le dénominatif de mirus) ou bien le composé d'un verbe dérivé (cogitare composé de agitare, le fréquentatif de agere). Dans le cas d'un substantif, l'éventail des combinaisons possibles est plus large, la structure substantif dérivé de verbe composé étant de loin la plus fréquente et aucun latiniste ne s'en étonnera (occasus et accasio, dérivés de occidere, le composé de cadere). On pourrait multiplier les exemples et montrer ainsi que, quels que soient les écueils auxquels se heurte la formalisation du vocabulaire, il devrait être possible d'identifier les quelques principes cohérents qui ont guidé l'évolution et l'enrichissement de la langue. Une fois ces principes définis, il devrait être possible d'établir des relations entre les séries les plus productives et les suffixes évoqués précédemment. 21 H. QUELLET, op. cit., pp. 185-188. Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. LA FORMALISATION DU VOCABULAIRE LATIN 357 Les voies dlinvestigation que je viens de tracer ne sont encore que des hypothèses de travail dont le bien-fondé doit être vérifié sur la base d'un corpus plus étenduj c'est là Pobjectif que je me suis fixé pour les mois à venir. Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.