![](//s1.studylibfr.com/store/data-gzf/fcb5efc3ebd70a5c8614aaee32ee7164/1/007509000.htmlex.zip/bg3.jpg)
Extrait de la Revue Informatique et Statistique dans les Sciences humaines
XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.
FoID.'IES
VERBALES
ET
FRÉQUENCE
287
indications précieuses sur la composition de l'œuvre, sur sa structure stylistique
et
thématique.
On
souhaiterait donc des index où la catégorisation lexicale des occurrences
se double, au moins pour les verbes, d'une sous-catégorisation grammaticale,
qui permettrait àl'usager de connaître non seulement la fréquence de chaque
verbe pris comme unité de lexique, mais celle des ensembles grammaticaux
constitués par la réunion de toutes les formes d'un même temps, d'un même
mode, d'une même personne. Tâche supplémentaire, dont il convient d'évaluer
le coût,
la
fiabilité
et
l'utilité.
Dans un article publié ailleurs, j'ai tenté un bilan des homographies
internes
du
verbe français; voici, en bref, le résultat de cet inventaire.
Sur les
51
formes simples (participes compris) que génère
la
"conjugaison"
d'un verbe français, 18 ne sont jamais ambiguësi4le sont dans tous les verbes,
mais pour
la
personne seulement; les 29 autres sont ambiguës dans un nombre
plus ou moins grand de verbes. Si l'on tient compte de la fréquence des formes
graphiques ambiguës, dont l'identification grammaticale exigerait un codage,
on peut l'estimer à20 %des occurrences verbales, soit 5%environ des mots
du texte. Au passage, jetons un regard d'envie sur ceux qui, comme Étienne
Évrard, travaillent sur une langue comme le latin classique, où le verbe ne
connaît d'homographies internes que dans un très
petit
nombre de formes de
très faible fréquence !
Mais une remarque sur ces fréquences:
la
proportion en formes ambiguës
est
la
plus faible dans les verbes les plus fréquents (les auxiliaires, les semi-
auxiliaires, les verbes irréguliers
(3'
groupe); elle est
la
plus forte dans les
conjugaisons régulières
(1"
et
2'
groupes).
Autre constatation utile: une bonne proportion des homographies verbales
coïncide avec une homograpWe lexicale.
Exemples:
soit la forme entre, qui a
378 occurrences dans le corpus analysé par
G.
Engwall (nous en reparlerons) jil
afallu toutes les
traiter
en contexte pour les
répartir
entre
la
préposition (347)
et
le
verbe (31); mais ces
31
entre représententprès de
la
moitié des formes de ce
verbe qui appelaient un examen grammatical; la forme porte (345 occurrences)
à
49
occurrences verbales, qui sont 80 %des formes ambignës
du
verbe porter;
même proportion
pour
reste dont 114 occnrrences (snr 195) sont verbales.
Une bonne partie de
la
tâche grammaticale
pourrait
donc, à
peu
de frais, être
accomplie en même temps que
la
lemmatisation.
L'indexation grammaticale des formes verbales n'est donc, par rapport à
l'indexation lexicale, qu'un supplément modeste. Reste às'interroger sur son
utilité et sur sa fiabilité.
Or)
je
crains que ces deux qualités n'aillent pas de
pair.