Chapitre 5 Augmentation lexico-sémantique pour la

publicité
Chapitre 5
Augmentation lexico-sémantique pour la
traduction automatique du français vers le tahitien
OU
Phénomènes contrastifs du tahitien et utilisations
de l’augmentation lexico-sémantique
5.1. Les méthodes de transfert lexical
L’apparition de nouvelles notions dans la langue cible fait apparaître de nouveaux
sens pour chaque mot-sens désambiguïsé dans la langue source. Cette émergence est due
aux différences de notions dans la langue source et dans la langue cible.
Ces nouvelles notions sont souvent des notions que l’on peut reconstruire à partir de
notions existantes dans la langue source. Par exemple, le tahitien fait une différence entre
la mer près du bord de la plage et l’océan dans les mots qu’elle emploie pour désigner les
mêmes choses. A tel point que «l’eau salée» se dit «te miti»1 ou «te tai» suivant d’où elle
provient, du bord de la plage ou de l’océan.
Ces nouveaux sens doivent être codés pour le transfert lexical dans un lexique afin
de pouvoir en tenir compte. Ce lexique de transfert lexical met en concordance les motssens de la désambiguïsation et les nouveaux sens dans la langue cible. Nous pouvons
utiliser les sens désambiguïsés et notre méthode de deux manières différentes pour obtenir
les mots-sens traduits : la première méthode utilise une seul thesaurus et permet
d’exprimer les mots-sens à traduire selon les notions de la langue source. La deuxième
méthode utilise un deuxième thesaurus, celui de la langue cible, pour les mots-sens
traduits.
5.1.1 Utilisation d’un seul thesaurus
Cette première méthode utilise un seul thesaurus, celui du français.
Ces nouveaux sens sont différenciés du mot-sens de la désambiguïsation des sens
des mots par l’ajout de projections sur les notions existantes du thesaurus, ces projections
représentant l’apparition des nouvelles notions de la langue cible.
Elle est illustrée par la figure 5.1.
La conception du lexique représente la première étape et est effectuée en trois
phases - (1a) et (1b) et (1c) dans la figure 5.1.
La première phase (1a) est la phase de traduction des mots-sens en leurs équivalents
dans la langue cible. En effet, même si nous trouvons le sens d’un mot après la
désambiguïsation sémantique, l’apparition des nouvelles notions entraîne des sens
nouveaux dans la langue cible. Pour chaque mot-sens dans la langue source, il est
nécessaire de répertorier dans la langue cible ses équivalents dans la langue cible.
Une fois les mots-sens associés à leurs équivalents, une projection reprsénet la
deuxième phase (1b). Elle permet de différencier les différents mots-sens les uns des
autres. En supposant que les notions du thesaurus contiennent toute la connaissance
1
Les mots tahitiens sont issus du Dictionnaire français-tahitien de Mgr Jaussen (1987).
humaine, les nouvelles notions de la langue cible doivent exister par rapport à celles de la
langue source. Les mots-sens de la langue cible peuvent se projeter sur le thesaurus déjà
utilisé de la langue source. Nous obtenons de nouveaux vecteurs sémantiques de ces motssens par l’intermédiaire de l’espace vectoriel décrit dans le chapitre trois.
Les équivalents dans la langue cible et leurs vecteurs sémantiques sont incorporés
dans le lexique de transfert lexical – phase (1c).
Figure 5.1. Le schéma de la première méthode de transfert lexical.
La deuxième étape consiste à reconstruire une nouvelle structure syntaxosémantique afin de pouvoir retrouver le bon équivalent dans la langue cible pour chaque
mot désambiguïsé dans la langue source. Elle permet de reconstruire de nouveaux
contextes avec de nouvelles notions.
Pour cela, les sens des mots dans la langue cible sont intégrés du lexique du transfert
lexical dans la structure syntaxo-sémantique sous les points représentant les mots-sens
désambiguïsés afin de permettre afin que les points-feuilles récupèrent les nouvelles idées –
phase (2a).
Les notions sont remontées vers le haut de la structure de la même manière que
l’augmentation lexico-sémantique donnée dans le chapitre trois. Cela représente la phase
(2b). On obtient les nouveaux contextes des textes et une nouvelle structure syntaxosémantique en fonction des mots-sens du lexique du transfert lexical.
Cela nous permet d’effectuer une désambiguïsation des mots-sens dans la langue
cible cette fois-ci. C’est l’étape (3) dans le schéma de la figure 5.1. On obtient alors les
mots-sens traduits dans la langue cible.
Le mérite de cette méthode est de pouvoir utiliser les mêmes de données que celles
décrites pour l’augmentation lexico-sémantique. C’est exactement le même processus que
pour la désambiguïsation des sens des mots dans la langue source.
Le premier inconvénient est l’effort du codage manuel à fournir et des connaissances
nécessaires à la traduction des mots-sens.
Le deuxième inconvénient repose sur le postulat utilisé i.e. utiliser le même thesaurus
de la langue source pour les mots-sens dans la langue cible. On verra que la deuxième
méthode préconise l’utilisation de deux thesaurus.
5.1.2 Utilisation de deux thesaurus
Elle repose sur les remarques suivantes :
Des notions nouvelles apparaissent dans la langue cible. Cela est vrai pour des langues
d’un même groupe de langues. Cela est encore plus vrai pour des langues qui ne font
pas partie d’un même groupe de langues comme le français et le tahitien. On ne peut
avoir un seul thesaurus pour les deux langues, le français et le tahitien.
Dans le cas de textes généraux, le découpage en notions de la langue source n’est pas
forcément le même que celui des notions dans la langue cible. Même si l’ensemble des
notions était le même d’une langue à l’autre, il y a une dérive d’une langue à l’autre des
champs sémantiques de telle manière que le sens des mots dans une langue source
n’est pas projeté sur les mêmes notions dans le thesaurus de la langue cible. Il n’y pas
de procédure clairement identifiable dans le passage d’une langue à l’autre.
Nous n’utiliserons pas de procédure générale de passage d’une langue à l’autre par
les thesauri en essayant de transformer les champs sémantiques du thesaurus de la langue
source en champs sémantiques du thesaurus de la langue cible.
Les mots-sens trouvés par la désambiguïsation des sens des mots ne sont pas
traduits tels quels en tahitien mais sont traités par un calcul en fonction des notions du
nouveau thesaurus de la langue cible. Cette méthode est illustrée par le schéma de la figure
5.2.
La méthode dans cette section est pratiquement la même que celle de la section
précédente, la différence se faisant au niveau de l’utilisation de deux thesauri au lieu d’un
seul.
En effet, la construction du lexique de transfert lexical suit les mêmes principes que
la première méthode mais les mots-sens équivalents traduits – phase (1) sur le schéma 5.2 sont à projeter dans le thesaurus de la langue cible au lieu du thesaurus de la langue source.
Par conséquent, un autre espace vectoriel est à créer – phase (2) sur le schéma 5.2, ce
que nous permet la grammaire structurelle vue dans le chapitre trois.
De la même manière, l’augmentation lexico-sémantique – phase (3) – crée une
nouvelle structure syntaxo-sémantique, en fonction des notions du thesaurus de la langue
cible cette fois-ci.
Figure 5.2. Schéma de la deuxième méthode de transfert lexical.
5.2. Autres phénomènes contrastifs
5.2.1. La dualité dans le pluriel
5.2.2. La relation de possession
5.2.3. La notion de proximité
5. 3. Les aspects
L'utilisation des divers temps correspond en tahitien à la description d'aspects du
verbe (Fare Vana'a, p.153) :
Contrairement au français, le tahitien est plus attentif à l'aspect de
l'action ou de l'état qu'au temps. Les formes verbales du tahitien sont
plutôt intemporelles à l'exception toutefois de certains passés
Diverses remarques :
- Les verbes sont différenciés en deux types de verbes, les verbes d'action et les verbes
d'état.
- Cette classification implique des comportements différents suivant le type.
- Les verbes répondent en tahitien à des aspects qui définissent alors les temps utilisés et
les situations posées (Fare Vana'a, p.153) :
L'aspect peut être défini comme la façon dont on considère l'action ou
l'état exprimé par le verbe.
- L'ouvrage précité constitue la description des différents aspects de manière à pouvoir
s'exprimer en tahitien. Une traduction du tahitien au français est ensuite donnée sans autre
forme d'explication. Il faut donc reconstruire les aspects en fonction des temps donnés en
français pour les verbes, donner les types des différents verbes tahitiens à leur chargement,
et construire un minimum de sémantique contextuelle pour pouvoir discriminer les
différents aspects. Cette construction correspond à une analyse du français
complémentaire, nécessaire pour regrouper certains éléments clés. Elle prend place avant
la discrimination sémantique des mots et des groupes de mots.
Voyons maintenant les différents aspects.
5. 3. 1. Le perfectif
Les verbes d’action
Description de l’aspect : L’action est considérée comme achevée à une époque de
référence. Si cette époque se situe au passé ou au futur, elle est normalement précisée par
un Complément Circonstanciel de Temps (en abbrégé, CCT). Un CCT peut aussi préciser
le présent. Si un verbe d’action est utilisé au Passé Composé et qu’il n’y a aucune référence
temporelle, le Perfectif est aussi utilisé.
Référence passée : Traduit le Passé composé + Cplt Circ de temps.
L’action est achevée à une époque passée.
Exemple : Il a coupé le cocotier, hier.  ‘Ua tapu ‘oia i te tumu ha’ari, inanahi.
Référence présente : Traduit le Passé composé + Cplt Circ de temps.
L’action est achevée au temps présent.
Exemple : Il a coupé le cocotier, à présent.  ‘Ua tapu ‘oia i te tumu ha’ari, i teienei.
Référence future :
Verbe intransitif : Traduit le Futur antérieur + Cplt Circ de temps.
Exemple : Il aura chanté, demain, à 8 heures du soir. 
‘Ua himene ïa ‘oia, ananahi, i te hora va’u i te po.
Verbe transitif : Traduit le Futur antérieur + Cplt Circ de temps.
L’action sera commencée mais pas forcément terminée à une époque future.
L’achèvement complet est souvent souligné par l’introduction d’un verbe d’état
approprié.
Exemples :
Demain, à trois heures de l’après-midi, il aura coupé le gazon. 
Ananahi, i te hora toru i te tapera’a mahana, ‘ua tapu ïa ‘oia i te matie.
Demain, à trois heures de l’après-midi, il aura coupé le gazon. (Il aura fini de couper le
gazon.) 
Ananahi, i te hora toru i te tapera’a mahana, ‘ua oti ïa i te matie i te tapuhia.
Aucune référence : Traduit le Passé composé sans Cplt Circ de temps.
L’action est achevée au moment où l’on parle.
Exemple :
Il a coupé le cocotier.  ‘Ua tapu ‘oia i te tumu ha’ari.
Les verbes d’état
Dans le cas d’un verbe d’état, l’aspect perfectif indique que l’état existe à une époque
de référence. A une époque située au futur ou au passé, elle est précisée par un adverbe de
temps ou un complément circonstanciel de temps.
Référence passée : Traduit le Passé composé + Cplt Circ de temps.
L’état a existé à une époque passée.
Exemple : Tu as eu faim, hier soir.  ‘Ua po’ia ‘oe inapo.
Référence présente : Traduit le Présent + Cplt Circ de temps.
L’état existe.
Exemple : Il est fatigué maintenant.  ‘Ua rohirohi ‘oia i teienei.
Référence future :
Traduit le futur antérieur + Cplt Circ de temps.
Exemple : Demain, tu auras oublié ce malheur. 
Ananahi, ‘ua ‘aramoina ïa teie ‘ati ia ‘oe.
Ou
Ananahi, ‘ua ‘aramoina ïa ia ‘oe teie ‘ati.
Traduit le futur simple + Cplt Circ de temps.
Exemple :
Demain à midi, je serai fatigué pour avoir beaucoup travaillé dans la matinée. 
Ananahi ‘ia avatea, ‘ua rohirohi ïa vau no te rahi o te ohipa ta’u i rave i te po’ipo’i ra.
Aucune référence : Traduit le Présent sans Cplt Circ de temps.
L’état existe au moment où l’on parle.
Exemple : Tu as faim.  ‘Ua po’ia ‘oe.
5. 3. 2. L’aspect imperfectif
L’aspect imperfectif, marqué par la particule E, ou dans certains cas par la particule
TE, indique l’idée de non-achèvement. Selon le sens à donner au verbe, cet aspect peut
être divisé en cinq sous-aspects :
Le futur.
Le duratif.
L’itératif.
L’optatif.
L’adjonctif.
La signification exacte dépend du type du verbe (action ou état).
Le futur
Les verbes d’action
L’action n’est pas encore commencée. Ce sous-aspect correspond au futur simple.
Exemple : Il ira en ville.  E haere ‘oia i te ‘oire.
Les verbes d’état
L’état n’existe pas encore. Ce sous-aspect correspond au futur simple.
Exemple : Tu seras fatigué ce soir.  E rohirohi ‘oe i te po.
Le duratif
Les verbes d’action
a) L’adverbe de la classe NEI possède une valeur temporelle.
L’adverbe NEI accompagne toutes les personnes (duratif présent, première
personne) :
Traduit le présent de l’indicatif.
Exemple : Tu lis le journal.  Te tai’o nei ‘oe i te ve’a.
L’adverbe RA accompagne toutes les personnes.
Le duratif passé : Traduit l’Imparfait de l’Indicatif.
Exemple : Lorsqu’il est arrivé, tu dînais.  I tona taera’a mia, te tama’a ra ‘oe.
Le duratif futur : Traduit le Futur dans le sens de « être en train de » avec une idée
de non-achèvement.
Exemple :
Demain à midi, lorsque tu arriveras, je serai alors en train de dîner. 
Ananahi ‘ia avatea, ‘ia tae mai ‘oe, te tama’a ra anei ïa vau.
b) L’adverbe de la classe NEI possède une valeur spatiale.
Lorsque l’adverbe de la classe NEI possède une valeur spatiale, en général :
NEI accompagne la première personne.
NA accompagne la deuxième personne.
RA accompagne la troisième personne.
Et en plus :
NEI indique que l’action se passe à proximité de la première personne.
NA indique que l’action se passe à proximité de la deuxième personne.
RA indique que l’action se passe à proximité de la troisième personne (ou à un
endroit éloigné).
Cette forme du duratif est réservée aux actions en cours au moment où l’on parle :
Exemples :
Je suis en train de lire le journal (ici).  Te tai’o nei au i te ve’a.
Tu es en train de manger (là). 
Te tama’a na ‘oe.
Le bateau est en train de partir (là-bas).  Te reva ra te pahi.
c) Valeur particulière de l’adverbe RA
Dans certains contextes, l’adverbe RA accompagne toutes les personnes et il est à prendre
ni avec une valeur temporelle, ni avec une valeur spatiale. Cela indique l’imminence de
l’action au moment de parler :
Exemple : Nous allons partir.  Te haere ra matou.
On ne peut utiliser une telle proposition qu’immédiatement avant l’exécution de l’action.
Quand l’action est commencée, il faut dire alors :
Exemple : Nous partons.  Te haere nei matou.
Remarque :
Avec les verbes de perception (‘ite, fa’aro’o, ta’a, etc.), on emploie généralement RA à toutes
les personnes pour le duratif présent :
Exemple : Est-ce que tu entends ? - Oui, j’entends. 
Te fa’aro’o ra ‘oe ? - ‘E, te fa’aro’o ra vau.
Les verbes d’état
Les verbes d’état sont moins souvent au duratif que les verbes d’action. Cependant,
avec un verbe d’état, le duratif peut avoir les significations suivantes :
a) Lorsque l’adverbe NEI accompagne toutes les personnes, le duratif indique :
Que l’état se manifeste au moment de parler :
Exemple : Il se réjouit de ton arrivée.  Te ‘oa’oa nei ‘oia i to ‘oe taera’a mai.
Que l’état est en train de s’établir au moment de parler :
Exemple : Le jour de la fête approche.  Te fatata mai nei te mahana ‘oro’a.
(Littéralement : Le jour de la fête est en train de devenir proche.)
b) Lorsque l’adverbe RA accompagne toutes les personnes, le duratif indique :
Que l’état se manifeste à une époque autre que le présent. Cette époque est
normalement précisée au passé et il est obligatoire de la préciser au futur :
Exemples :
a)
Lorsque tu es arrivé hier au soir, nous nous réjouissions. 
I to ‘oe taera’a mai inapo, te ‘oa’oa ra maua.
b)
Demain soir, lorsque tu arriveras, nous serons en train de nous réjouir. 
Ananahi ‘ia po, ‘ia tae mai ‘oe, te ‘oa’oa ra ïa maua.
Que l’état est en train de s’établir à une époque autre que le présent. Il y a lieu de
préciser cette époque :
Exemples :
a) Ils sont sans doute arrivés maintenant, en effet hier, ils approchaient de la ville. 
‘Ua tae mai paha ratou ‘i teienei, inaha inanahi ra, te fatata mai ra te ‘oire ia ratou.
b) Demain, ils approcheront de la ville. 
Ananahi, te fatata mai ra ïa ta ‘oire ia ratou.
L’itératif
Les verbes d’action
L’itératif correspond à indiquer la nature répétitive d’une action. Ce sous-aspect est
complètement intemporel ; le temps est déterminé par le contexte qui doit être tel que
l’on ne puisse pas confondre un itératif avec un futur.
L’itératif est le sous-aspect que l’on utilise pour les actions habituelles.
Exemples :
a)
Je fume. 
E puhipuhi au i te ‘ava’ava.
b)
Autrefois, les polynésiens priaient sur des « marae ». 
I te matamua, e pure te ma’ohi i ni’a i te marae.
Les verbes d’état
L’itératif indique l’existence répétitive de l’état :
Exemple : Il est fatigué tous les soirs.  E rohirohi ‘oia i te mau po ato’a.
L’optatif
L’optatif ne peut s’employer qu’avec des verbes d’action.
C’est une forme adoucie de l’impératif. On l’emploie à chaque fois que l’impératif
risque de paraître trop brutal ou que l’ordre ne présuppose pas une exécution immédiate :
Exemples :
a)
Ö dieux ! Ayez pitié de votre assemblée de prêtres ! 
E te atua e ! E aroha mai i to taura tahu’a nei !
Tu couperas bien cet arbre et tu arroseras les fleurs ! 
E tapu ‘oe i tera tumu ra’au ‘e e pipi ‘oe i te tiare !
Remarques :
a) Construction avec MAI placé immédiatement avant le verbe.
Exemple : Allons dans les bourgs voisins.  Mai haere tatou i te mau ‘oire fatata nei.
Elle exprime l’idée d’une suggestion ou d’une invitation.
b) Avec TAUA et TATOU, l’optatif peut aussi être utilisé en plaçant le sujet devant
la particule verbale :
Exemple : Pétrissons de l’argile .  Tatou e oi i te ‘araea .
L’adjonctif
L’adjonctif ne peut s’employer qu’avec des verbes d’action.
Un verbe consécutif à un autre peut être mis à ce sous-aspect, pour indiquer que
l’action désignée par le deuxième verbe dépend de celle désignée par le premier.
Exemple : Il est allé au magasin chercher du pain. 
‘Ua haere ‘oia i te fare toa e ti’i i te faraoa.
Téléchargement