Reflexions, le site de vulgarisation de l'Université de Liège
© Université de Liège - http://reflexions.ulg.ac.be/ - 19 April 2017
- 1 -
Sous le regard de Ramsès
10/01/08
Une présentation lors du Congrès des égyptologues qui s'est tenu en mai à Rhodes, une communication
en séance plénière lors de la table ronde «informatique et égyptologie» réunie à Vienne en juillet : deux
moments-clés qui ont secoué le petit monde de l'égyptologie et officialisé les débuts de Ramsès. Ramsès
? Un extraordinaire outil qui réunit informatique et égyptologie. De quoi percer les derniers secrets de
l'écriture hiéroglyphique. Un travail de longue haleine mené à bien par Jean Winand et son équipe du service
d'égyptologie de l'ULg.
Disposer d'un outil de recherche efficace d'un point de vue
linguistique et philologique : tel est le point de départ du projet Ramsès. «Nous avions constaté, explique
Reflexions, le site de vulgarisation de l'Université de Liège
© Université de Liège - http://reflexions.ulg.ac.be/ - 19 April 2017
- 2 -
le professeur Jean Winand, que la recherche en langue égyptienne était freinée faute d'un accès aisé à la
documentation. Si vous avez une idée et que vous voulez tester votre hypothèse, il faut retourner au texte.
C'est-à-dire soit relire vos notes, mais elles ne sont jamais complètes, soit relire tout le corpus. Cela devient
vite impossible. Il fallait concevoir des outils pour accéder rapidement à l'information.»
Des outils, il en existe depuis que l'égyptologie existe. Le projet Ramsès ne part pas de zéro. Le premier outil
qui vient à l'esprit est évidemment le dictionnaire. Mais ils sont souvent anciens et ne donnent pas toutes
les références d'un mot, se contentant de citer quelques exemples. Cela ne suffit pas pour des chercheurs.
Ceux-ci doivent viser l'exhaustivité. En outre, les dictionnaires ne sont trop souvent que des listes de mots. Ils
renseignent peu ou pas sur la grammaire et ce n'est pas eux qui vont permettre de travailler, par exemple, sur
les subjonctifs de tous les verbes d'un certain type. Et ce n'est pas eux non plus qui vont permettre la recherche
d'un mot à partir de ses différentes flexions. Autre exemple: dans l'écriture hiéroglyphique (Pour s'y retrouver
dans les différentes langues et écritures, lire Les écritures et les langues de l'ancienne Egypte), il n'y a pas
d'orthographe proprement dite, tout au plus des habitudes graphiques. Un même mot peut apparaître avec des
graphies un peu différentes. Mais un chercheur peut avoir besoin de toutes les graphies. Il lui faudrait donc un
outil les occurrences seraient triées selon les graphies. Et encore, il ne s'agit que de recherches simples.
Les recherches combinées sont impossibles avec les outils existants. Comment faire si l'on désire repérer
toutes les conjonctions d'un texte et mettre en évidence le temps du verbe qui les suit ? Comment aussi repérer
facilement toutes les phrases qui comportent une expression composée de plusieurs termes ? Ou affiner les
résultats et recherches en fonction de la date du document, du type d'écriture, hiéroglyphique ou hiératique,
ou en fonction du genre littéraire et de l'origine géographique ? Actuellement, tout cela est impossible à tester.
La création d'un outil informatique
Seule l'informatique permet de répondre à des demandes aussi exigeantes. «Nous avons eu une visée
maximaliste, se souvient Jean Winand. Nous avons créer une structure. Il était en effet impossible d'utiliser
les logiciels de bases de données qui existent dans le commerce, ni même de les bricoler. On a donc imaginé
un cahier des charges le plus large possible, sans limites techniques. Je ne voulais pas de la démarche inverse:
s'enfermer dans une technique, puis voir ce qu'on pouvait faire avec cela.» L'équipe liégeoise a donc travaillé
avec un collègue français qui est, et il est sans doute seul au monde dans son cas, à la fois informaticien et
égyptologue! Professeur en informatique à Paris VIII et responsable du cours d'introduction au néo-égyptien
à l'EPHE (Ecole pratique des hautes études à Paris), Serge Rosmorduc était en effet la personne idéale pour
développer la programmation informatique.
Le projet a véritablement démarré en 2006, lors de la Table Ronde "Égyptologie et Informatique" qui s'est
tenue à Oxford. L'équipe de Ramsès a conçu de front deux modules. L'un est la constitution d'un lexique
(dictionnaire) de référence, l'autre un éditeur de textes. Le programme Ramsès porte sur le néo-égyptien, la
langue vernaculaire du Nouvel Empire et de la Troisième Période Intermédiaire, aussi bien les textes en langue
hiéroglyphique que hiératique. Le corpus est constitué de textes littéraires et de textes de la pratique. Ces
derniers sont à comprendre au sens le plus large: lettres, textes administratifs, actes notariés, commerciaux,
textes juridiques. Quant aux premiers, ce sont des contes et "romans" mais aussi de la poésie et des textes de
sagesse qui sont des recueils de préceptes de vie, des textes royaux (récits de bataille, décrets) et religieux.
Mais ces derniers sont rares puisqu'ils relèvent plutôt de la langue dite de tradition, exclue du corpus de
Ramsès.
Reflexions, le site de vulgarisation de l'Université de Liège
© Université de Liège - http://reflexions.ulg.ac.be/ - 19 April 2017
- 3 -
L'encodage des textes
Pour l'instant, l'encodage des textes est fait par des
égyptologues la main": ils introduisent dans l'ordinateur une translittération c'est-à-dire une transcription
de la structure phonologique des hiéroglyphes dans notre alphabet. En fonction de ce qui a été analysé, la
machine propose une lemmatisation, et affiche les flexions et les graphies (hiéroglyphes) qui existent déjà.
Toute nouveauté (mot nouveau, nouvelle graphie, etc.) viendra s'ajouter dans la base de données. Cette
opération d'encodage se fait mot à mot par l'égyptologue. «Mais nous voulons aller beaucoup plus loin, précise
Jean Winand, grâce à une thèse de doctorat en informatique qui doit déboucher sur la mise au point d'un
automate qui nous aidera à analyser la langue. Attention ! Nous ne faisons pas de la reconnaissance optique :
il est impossible de partir du signe car il n'y a pas de standardisation des signes chez les égyptologues ;
à côté d'éditions imprimées (et les fontes d'hiéroglyphes ne sont pas uniformisées), les signes sont encore
souvent dessinés à la main! L'automate partira de la translittération, la lira, fera une analyse de contexte
et, en retournant aux dictionnaires qui existent, livrera sur base statistique une proposition d'analyse la plus
vraisemblable. Nous sommes donc en train de lui apprendre des règles de syntaxe et comment combiner cela
avec la réalité morphologique.»
Dès qu'une phrase ou un texte sera encodé, l'automate pourra donc dire que tel mot est un substantif au
masculin singulier et que dans telle phrase, il est un objet direct. L'objectif n'est pas de traduire. «Pour nous,
explique Jean Winand, cela n'a guère d'intérêt. Ramsès est conçu pour faire des recherches sur des textes.
Nous retraduisons les textes nous-mêmes si nécessaire. Dans un travail scientifique, la traduction automatique
n'a aucun sens : trop lourde à mettre en place, et surtout pas assez précise. C'est vrai pour toutes les langues,
même les mieux connues.» L'automate proposera aussi des graphies. Une fois que le mot sera identifié
et analysé, l'automate retournera vers le dictionnaire existant. Il y retrouvera une série de graphies dont il
éliminera certaines en fonction de la flexion (forme du mot); il fera ensuite des choix en fonction du type de
texte, de l'époque, etc. Bien sûr, tout ce que produira l'automate sera toujours validé par l'égyptologue.
Reflexions, le site de vulgarisation de l'Université de Liège
© Université de Liège - http://reflexions.ulg.ac.be/ - 19 April 2017
- 4 -
Comment se présentent les mots et les textes de la base de données ?
Chaque mot fait l'objet d'un bloc. Dans ce bloc, on retrouve chaque fois les mêmes éléments : le mot apparaît
dans sa translittération et sa graphie.
Il est aussi traduit, lemmatisé et analysé : il s'agit ici de la 3ème personne du singulier masculin d'un pronom
indépendant. «Supposons, explique Jean Winand, qu'on rencontre le verbe iri «faire» dans un texte et qu'on
veuille l'encoder. Je vois tout de suite qu'il est déjà dans la base de données. Je le sélectionne donc.
Immédiatement, les différentes flexions déjà attestées pour ce verbe apparaissent : en l'occurrence ici, les
différentes formes conjuguées du verbe déjà présentes dans le corpus. Si j'en sélectionne une, par exemple
l'impératif, toutes les graphies en rapport avec l'impératif s'affichent; ce sont souvent des variantes minuscules,
mais des variantes quand même puisqu'aucune règle ne régit l'orthographe. Soit je trouve mon bonheur
dans ce qui existe, soit j'ajoute cette forme nouvelle dans la base de données. Il en va ainsi pour toutes les
composantes de l'analyse.»
Reflexions, le site de vulgarisation de l'Université de Liège
© Université de Liège - http://reflexions.ulg.ac.be/ - 19 April 2017
- 5 -
Bien entendu, seules les personnes autorisées peuvent apporter leur pierre à l'édifice. La base de données est
évidemment verrouillée. Autre nouveauté du système : il tient compte des signes critiques qui permettent de
1 / 9 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !