La formalisation du vocabulaire latin problèmes de méthode

Extrait de la Revue Informatique et Statistique dans les Sciences humaines
XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.
La
formalisation
du
vocabulaire
latin
problèmes
de
méthode
Ghislaine
VIRÉ
Le
sujet
que
je
me
propose de
traiter
ne
correspond
peutMêtre
pas
exac-
tement
au
thème qui aété retenu
pour
ce colloque, àsavoir "Le nombre
et
le
texte. Méthodes quantitatives dans les études littéraires
et
linguistiques".
En
effet, mon propos vise àidentifier les problèmes que pose
la
structuration
du
vocabulaire
latin
dans
la
perspective
d'un
traitement
automatisé
et,
dans
un
second temps, àconcevoir les solutions susceptibles de résoudre ces difficultés.
C'est
dire que mon travail se situe en
amont
de
l'ordinateur,
plus précisément
àce
stade
de
la
recherche -délicat, mais passionnant entre tous -qui touche
àl'analyse
du
problème.
La
plupart
des réflexions que
je
vais vous proposer
relèvent donc du domaine méthodologique, le domaine -faut-il encore le rap-
peler? -
dans
lequel l'utilisation de
l'ordinateur
suscite souvent des remises en
question novatrices des vues traditionnelles
attachées
ànos disciplines.
Ceci dit, je
m'en
voudrais de
taire
la
principale raison de
ma
présence à
Liège:
j'ai
tenu àm'associer à
l'hommage
amical
rendu
à
Étienne
Évrard
à
l'occasion de ce colloque
et
saisir l'occasion qui
m'était
offerte
de
le remercier
pour l'accueil qu'il
m'a
réservé, il y a plus
de
quinze ans,
au
certificat
d'études
complémentaires en analyse linguistique
par
ordinateur
du
L.A.S.L.A.
et
pour
l'intérêt
qu'il atoujours témoigné
aux
travaux
que nous effectuons
au
G.I.T.A.,
tant
dans
le
domaine de l'E.A.O. que dans le traitement automatisé des textes.
*
* *
Les travaux que
j'ai
entrepris
dans
le domaine
du
vocabulaire se
situent
daus
le cadre plus large de l'expérimentatioll,
au
niveau
du
latin,
du
système
d'enseignement assisté par ordinateur implanté àl'V.L.B. (le système PLATO).
Au-delà, ou plutôt en deçà de l'élaboration de didacticiels -essentiellement
centrés
sur
des exercices
d'entraînement
aux
automatismes linguistiques -
Extrait de la Revue Informatique et Statistique dans les Sciences humaines
XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.
346
GHISLAINE
VJRÉ
notre
objectif
général consiste àdégager
d'un
certain
nombre
de
matières
grammaticales
du
latin
les
structures
profondes
permettant
de les formaliser
et,
si possible,
d'en
tirer
des
algorithmes
de résolution
de
problème.
Je
tiens
àpréciser d'emblée que
par
structures
profondes
d'une
matière
j'entends
l'organisation logique qui
sous-tend
l'ensemble de
cette
matière
et
s'enracine
dans
l'histoire de
la
langue. Si,
dans
le
domaine
de
la
morphologie, celle
du
verbe
surtout,
il
est
possible de
parvenir
à
une
structuration
parfaite,
fondée
sur
un
schéma
général!,
pour
le vocabulaire, le problème se pose
en
termes
tout
différents,
ne
fût-ce que
parce
que l'ensemble des données
sur
lesquelles
on
travaille
est
beaucoup
plus difficile àcerner
que
dans
le cas de
la
conjugaison
on
part
d'un
nombre fini de formes.
Pour
définir les limites
de
mes
recherches,
je
préciserai
tout
d'abord
que
mon travail
n'a
ni
l'ambition,
ni
la
prétention
d'embrasser
la
totalité
du
vocabulaire
latin.
Pour
des raisons
d'ordre
matériel
et
aussi parce que le
but
que
je
poursuis
est
de
nature
pédagogique, le
point
de
départ
de mes dépouillements
est
le lexique de base pnblié
par
mes
collègues J.-H. Michel
et
M.
Gester
2,qui
regroupe les qnelque
3500
mots
les pIns
fréquenunent
utilisé
par
les
anteurs
figurant
au
programme
de l'enseignement secondaire belge. Il
va
sans
dire que
la
notion de fréquence, quelle
qu'en
soit
par
ailleurs
l'utilité
pour
l'acquisition
d'un
vocabulaire élémentaire,
aboutit
souvent
à
tronquer
les familles
de
mots
et
àfaire
disparaître
une
partie
de
la
richesse lexicale
d'une
langue. Force
m'a
donc
été
de sélectionner encore
d'autres
mots,
qui
tous
appartiennent
à
la
langue
de
l'époque
classiqne
et
àcelle
de
débnt
de
l'Empire
et,
pour
ce faire,
j'ai
en
recours
au
dictionnaire
d'Ernout
et
Meillet3
et
au
dictionnaire publié
par
le
L.A.S.L.A.4 jàce propos
je
tiens
àremercier mon collègue J. Denooz qui a
eu
la
gentillesse de
me
faire parvenir les listings complémentaires qui
m'ont
permis
d'affiner mes dépouillements.
*
* *
La
première
structuration
àlaquelle
on
songe
tout
naturellement
lorsqu'il
s'agit
de
traiter
le vocabulaire
est
évidemment
celle qui repose
sur
les familles de
mots
(c'est-à-dire les familles fondées
sur
l'étymologie); non
seulement
c'est
la
1
Gh.
VIRÉ,
Une
expérience d'enseignement assisté par ordinateur:
la
conjugaison latine,
Grec
et
Latin
en
1981, Bruxelles,1981,pp.
93-105.
2J.-H. MICHEL
et
M.
GESTER,Lexique
de
base
du
latin, Anvers, 1967.
3
A.
ERNOUT
et
A.
MEILLET,Dictionnaire étymologique
de
la
langue latine. Histoire des
mots, 4e
édition,
Paris,
1967.
4Dictionnaire et index
inverus
de
la
langue latine, Liège, 1981.
Extrait de la Revue Informatique et Statistique dans les Sciences humaines
XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.
LA
FORMALISATION
DU
VOCABULAIRE
LATIN
347
présentation adoptée de plus en plus souvent
dans
les manuels
de
référence1mais
c'est aussi un schéma qui semble,àpremière vue,correspondre parfaitement
àune des
structures
non linéaires les plus utilisées
en
informatique:
je
veux
parler de l'arbre.
Est-il nécessaire de rappeler que
l'arbre
est
conçu comme
un
ensemble fini
d'éléments répartis entre
la
racine A
et
les sous-arbres qui y
sont
directement
rattachés
B,
C,
D,
chacun de ceux-ci
pouvant,
àson
tour,
servir de racine àde
nouveaux sous-arbres
E,F,G,
...
EF
H J
niveau 0
niveau 1
niveau 2
niveau 3
Figure 1
L'arbre
pris
au
sells
mathématique
du
terme
se distingue donc
de
l'arbre
généalogique
dans
la
mesure les mariages entre cousins,même éloignés, sont
exclus. Généralement
la
racine est définie comme
étant
de
niveau zéro
et
tout
sous-arbre
est
de
niveau égal à
la
racine àlaquelle
il
se
rattache,
augmentée
d'une
unité.
S'appliquant parfaitement àtoute classification logiquement ordonnée, la
structure
arborescente
devrait
pouvoir
s'adapter
aussi
aux:
familles
de
mots
du
latin. On peut, en effet, poser comme hypothèse de travail qu'il devrait être
possible de concevoir
un
schéma théorique en forme
d'arbre
qui
reprendrait
l'ensemble des potentialités du lexique latin,
étant
bien entendu que, pour
chaque famille, ne seraient effectivement occupées que les cases correspondant
aux
mots
attestés
dans
la
tradition
littéraire.
Si
cette
hypothèse
s'avérait
fondée,
il
devrait
être
possible,
dans
la
perspective
d'un
traitement
automatisé,
d'attribuer
àchaque
mot
un
numéro
d'ordre
qui tienne
compte
tout
à
la
fois
de
sa
catégorie grammaticale
et
du
niveau auquel
il
se situe
par
rapport
au
mot
simple pris
pour
racine de
l'arbre.
En
guise
d'illustration,
je
citerai le code que
nous avions
prévu
d'utiliser, en
l'appliquant
1
pour
plus de facilité, àune
partie
seulement de la famille de ire.
Toute codification est arbitraire, chaque utilisateur décidant des éléments
qu'il
souhaite privilégier
dans
le classement jon
peut
donc également
ramener
Extrait de la Revue Informatique et Statistique dans les Sciences humaines
XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.
348
56.00.00.00
56.54.00.00
56.54.13.00 1
56.54.15.00
56.54.13.21
ambitus
GHISLAINE
VIRÉ
niveau 0
niveau 1
niveau 2
niveau 3
Figure 2
1
er
chiffre: catégorie
grammaticale
(1
=
subst.
j2
:;::
adj. i3=
nom
de
nombre
i4
:;::
adj.
pron.
i5=verbe i
6=adv. j7=
prép.)
2echiffre: sous-catégorie
grammaticale
Par
ex.
51
=
le
canj.} 52 =2e
canj.,
53 3e
canj.,
54 4e
canj.,
55
=4e
canj.
bis.
56 =v.
remarquables.
le code grammatical à
un
seul chiffre
et
ajouter
uu code
indiquant
s'il
s'agit
d'un
dérivé
ou
d'un
composé.
Pour
séduisante qu'elle soit, àpremière vue,
cette
structuration
n'est
cependant
pas entièrement satisfaisante
dans
tous les cas. Ainsi, les
mots
qui
se
rattachent
àune même racine
sans
avoir
de
lien direct les uns avec les
autres
ne trouvent-ils
pas
aisément place
au
sein de
l'arbre,
la
seule solution
scientifiquement acceptable consistant àles considérer chacun
comme
mot
simple, ce qui revient àmultiplier les schémas, donc àatomiser les
structures.
Le cas des
mots
issus de
la
racine *
lfic-j*Hic-
est
exemplaire àcet
égard:
lux,
lumen,
Luna,
lustrare, luculentus...
n'ayant
guère de dérivés
ou
de composés
constituent
les racines
d'arbres
souvent squelettiquesj
en
revanche, le cas de
sisto, sto
et
*-stano (ce dernier
attesté
seulement
en
composition)
est
plus
favorable)
dans
la
mesure
de sisto
et
de sto
sont
issus des
mots
nouveaux.
La systématisation du vocabulaire débouche rapidement sur des cas limites
que le philologue se voit
contraint
de trancher)
sans
que les données actuelles
de
la
lexicographie
latine
lui
en
donnent
toujours
les moyens. Ainsi) comment
situer)
l'un
par
rapport
à
l'autre,
les trois
mots
iudex, iudicare
et
iudicium?
S'il
est
certain
que iudicare est le dérivé
direct
de iudex, iudicium doit-il
être
considéré comme
un
substantif
de formation parallèle
au
verbe
ou
comme le
dérivé de celui-ci)
bâti
sur
le même
schéma
que gaudium à
partir
de
gaudere?
Pour
ma
part,
j'incline àplacer iudicare
et
iudicium
au
même niveau) ne fût-
ce que parce que les témoignages parallèles
ne
fournissent
aucun
critère de
choix (d'une
part,
il
y a très peu de substantifs en -ium dérivés de verbes de
la
première conjugaison -fiagitium, opprobr-ium, suspirium
-j
d'autre
part,
Extrait de la Revue Informatique et Statistique dans les Sciences humaines
XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.
LA
FORJ,fALISATION
DU
VOCABULAIRE
LATIN
349
dans
le cas de arbiter, on
met
généralement sur le
même
plan
arbitrari
et
arbitrium).
o
1
2
3
Figure 3
Famille
de
decet
o
1
2
3
Figure
4
Famille
de
aequus
Aces difficultés, somme
toute
surmontables moyennant l'intervention
du
philologue, s'en
ajoutent
d'autre,
plus fondamentales, qui
remettent
en
question
l'adéquation
même
de
la
structure
arborescente à
la
formalisation
du
vocabulaire.
Quand
on adopte
un
schéma théorique, il
est
indispensable,
en bonne
méthode,
d'examiner
la
façon
dont
se distribuent les cases vides,
autrement
dit
les modalités selon lesquelles le schéma se réalise effectivement
dans
chaque cas. Or, si
l'on
a
la
curiosité de comparer les
structures
de plusieurs
familles, que celles-ci remontent àun
mot
simple de même
nature
grammaticale
ou pas, on est frappé
de
constater combien ces schémas diflèrent les
uns
des
autres
ije
n'en
veux
pour
preuve que les trois
structures
suivantes qui visualisent
les familles de decet, videre
et
aequas (voir figures 3 à5). On doit en conclure
que le schéma théorique en forme
d'arbre
n'a
pas
vraiment
de
portée
générale
1 / 13 100%

La formalisation du vocabulaire latin problèmes de méthode

La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !