Telechargé par Nivine Kanâan

Approches Fondamentales en Linguistique Informatique

publicité
Center de Sciences du Langage et de la communication (CSLC)
Présenté par: Nivine kanâan-Omar (201411).
Travail soumis à: Dr. Ziad Mikati.
1ère année Mastère de recherche en TALN.
Approches fondamentales en linguistique informatique
Année universitaire : 2020-2021.
Approches fondamentales en linguistique
Informatique
Analyse et traduction de phrases - SDL Trados
1
Présentation du projet :
L'objectif de ce projet de recherche est de traduire en langue anglaise le corpus suivant provenant
des « Avertissements en vigueur » de l’État du réseau routier à Québec (Capitale-Nationale), à
Canada. La source du corpus est le site du ministère des transports canadiens dont la référence
sitologique est : https://www.quebec511.info/fr/diffusion/etatreseau/avertissements.aspx
Ce travail est basé sur une analyse syntaxique à l'aide du logiciel informatique SDL TRADOS
STUDIOS 2019. Alors la traduction de ce corpus sera procédée de l'anglais vers le français.
Corpus:
Fermeture route Saint-Joseph entre le rang Saint-Joseph et la rivière Chaude.,
Direction OUEST et EST, Saint-Basile, durée indéterminée, détour réseau local.
Cause: Mesures préventives.
Stratégie de traduction:
Pour accomplir la traduction, on utilise la traduction fidèle qui consiste à rembourser le sens tout
en respectant les aspects linguistiques de corpus: les termes, la ponctuation et le style, qui
réapparaissent dans le texte-cible. Quelques modifications peuvent s’appliquer pour assurer la
conformité aux règles esthétiques, tout en servant de la traduction sémantique.
Traduction du corpus via le logiciel SDL Trados :
2
3
Phrase 1 :
Fermeture route Saint-Joseph entre le rang Saint-Joseph et la rivière Chaude.,
Analyse syntaxique :
Segmentation et regroupement en syntagmes :
Fermeture route
Saint- entre
Joseph
N2
NP
Prép
NE1
N1
SN2
SN1
le
rang
Saint- et
Joseph
Dét
N3
NP
Conj
NE2
SN3
SP2
SP1
SP1
P
rivière Chaude
la
Dét
N4
Adj
NE3
SN4
SConj
[P [SN1 [N1+SN2[NE [N2+NP]] + [SP1 [SP2 [Prep+SN3 [Det+NE2 [N3+NP]]
+SConj [Conj+SN4 [Det+NE3 [N4+Adj]]]]]]
P
SN1
SP1
Nom
SN2
SP2
SConj
Fermeture
Conjonction
Nom Expansé1
Préposition
SN3
SN4
et
entre
Nom
Nom propre
Déterminant
le
route
Nom
Saint-Joseph
NE2
Déterminant
Nom propre
NE3
la
rang
Saint-Joseph Nom adjectif
rivière chaude
4
P’= Closure of Saint-Joseph road between Saint-Joseph place and the Chaude river.
P’
SN1
Nom
SPrep1
SConj1
SN2
Closure
Conjonction
Of
Nom Expansé1
Nom propre
SPrep 2
Nom
SConj
SN3
Conjonction
préposition
Saint-Joseph
road
NomExpansé2
between
Nom propre Nom commun
Saint-Joseph
road
SN4
and
déterminant Nom Expansé3
the
adjective
nom
chaude
river
5
Règles de transfert:
Français
Anglais
P→ SN1+SP1
P’→ SN1+SP1
Censément, il parait que les deux phrases présentent la même construction, surtout, au niveau
de la segmentation. Mais, des différences s’installent, au niveau de la structure de surface,
après l’achèvement de la traduction.
SN1→N+SN2
SN2→NE
NE→N+NP
Il existe 3 éléments: Deux noms et un nom
propre.
Route (nom commun, féminin, singulier) et
Saint-Joseph (nom propre, masculin,
singulier) constituent ensemble un nom
expansé qui complète le nom fermeture (nom
commun, féminin, singulier).
SN1→N+SConj
SConj→Conj+SN2
SN2→NE
NE→NP+N
Les 3 éléments de discours sont transformés
en 4 : Deux noms, un nom propre, et une
conjonction.
Closure (nom, singulier, neutre), suivi d’une
conjonction of, ce qui lui rend un nom. SaintJoseph (nom propre, masculin, singulier) road
(nom, singulier, neutre) est un nom expansé
qui complète le nom closure.
Le nom propre précède le nom commun en
anglais, à l’inverse du Français, d’après
lequel, le nom commun est suivi par le nom
propre.
SP1→SP2+SConj
SP1→SP2+SConj
Apparemment, il semble que les syntagmes présentent la même construction. Mais, des
différences s’installent, au niveau de la segmentation détaillée de la structure de surface, après
l’achèvement de la traduction.
SP2→P+SN3
SP2→Prep+SN3
SN3→Dét+NE2
SN3→NE2
NE2→N+NP
NE2→NP+N
« entre » (préposition) lie SP1 avec SN1, qui
« Between » (préposition) lie SP1 avec SN1,
est la première partie de la phrase.
est la première partie de la phrase.
« entre » est suivie de « le » (déterminant,
« Between » est suivie d’un nom expansé
pronom personnel, masculin, singulier), et
« Saint-Joseph road » composé de Saintd’un nom expansé « rang Saint-Joseph »
Joseph (Nom propre, masculin, singulier) et
composé de rang (nom commun, masculin,
road (nom commun, singulier, neutre). Il
singulier) et « Saint-Joseph » (Nom propre,
n’existe pas un déterminant, et l’ordre change
singulier, masculin).
en Anglais, alors le nom propre précède
« Le » s’accord en genre et en nombre avec
« Saint-Joseph » le nom commun « road ».
rang.
6
En Anglais, la plupart du temps, le genre est
neutre, donc l’accord se fait en nombre.
SConj→Conj+SN4
SN4→Dét+NE3
SConj→Conj+SN4
SN4→Dét+NE3
Apparemment, il semble que les deux grands syntagmes présentent la même construction. De
même, les petits syntagmes suivants, mais, des différences s’installent, au niveau de la
segmentation détaillée de la structure de surface, au niveau de la construction du nom expansé,
après l’achèvement de la traduction.
SConj→Conj+SN4
SN4→Dét+NE3
« et » est une conjonction qui lie les deux
syntagmes de la deuxième partie de la
phrase : SP2 et SN4.
« et » est suivie d’un syntagme nominal SN4
composé d’un déterminant « la » (pronom
personnel, féminin, singulier) qui précède le
nom expansé « rivière Chaude », qui est
considéré comme un nom propre, composé de
« rivière » (nom commun, féminin, singulier)
et « Chaude » (adjectif, féminin, singulier).
L’adjectif « Chaude » est accordé à « rivière »
par le genre et le nombre.
SConj→Conj+SN4
SN4→Dét+NE3
« and » est une conjonction qui lie les deux
syntagmes de la deuxième partie de la
phrase : SP2 et SN4.
« and » est suivi d’un syntagme nominal SN4
composé d’un déterminant « the » (neutre,
utilisé en même forme en singulier et pluriel)
qui précède le nom expansé «Chaude river»,
qui est composé de « Chaude » (adjectif,
calque du Français) et le nom « river » (nom
neutre, singulier).
« Chaude » qui est un adjectif en Français
constitue en Anglais un nom propre
inchangeable.
NE3→Adj+N
« Chaude » emprunté du Français comme un
nom propre, est un adjectif qui précède le
nom « river » (nom, singulier, neutre) car en
Anglais, le nom suit l’adjectif : c’est une
inversion.
NE3→N+Adj
« rivière » (nom commun, féminin, singulier)
est suivie de L’adjectif « chaude » (adjectif,
féminin, singulier).
En Français, l’adjectif suit le nom, dans la
plupart du temps, et il s’accord avec lui en
genre et en nombre.
Dans le cas d’ajout d’un déterminant, ou d’une conjonction, ou d’une préposition, c’est une
insertion, en cas de translation vers l’Anglais. De même, si l’un de ces éléments existe déjà : Si
c’était un déterminant, alors il est obligatoire de la garder, mais, dans le cas de préposition ou
d’une conjonction, les règles de chaque langue s’imposent, comme « closure of » au lieu de
« fermeture ».
7
Phrase 2 :
Direction OUEST et EST, Saint-Basile, durée indéterminée, détour réseau local.
Analyse syntaxique :
Segmentation et regroupement en syntagmes :
Direction OUEST
et
N1
N2
CC : NE1
Conj
EST
SaintBasile
Adj
NP
CC : NE2
durée
indéterminée détour
N4
Adj
réseau
local
N6
Adj
N5
NE3
NE4
SN5
SN4
SAdj1
SConj
SConj
SN3
SN2
SN2
SN2
SN2
SN1
P
[P[SN1[SN3[NE1[N1+Adj]]+[SConj
[Conj+SAdj1[NE2[Adj+NP]]]+SN2[SN4[NE3[N4+Adj]]+SN5[N5+NE4[N6+Adj]
]]]]]
P
SN1
SN2
SConj
SN3
SN4
SN5
Conjonction SAdj
Nom Expansé1
Nom Expansé2
Nom
Adjectif
Direction
Nom Expansé4
détour
Nom Adjectif
Nom Expansé3
et
Adjectif
Nom
Nom propre Nom Adjectif
Ouest
Est
Saint-Basile durée indéterminée
réseau
local
8
P’= Westbound and eastbound direction, Saint-Basile, undetermined period, local network
detour.
P’
SN1
SAdj1
Adj
SN2
SN3
SConj
SAdj2
NE
Conj
Adj
Nom
Adj
NP
Adj
Nom
N
period
local
and
eastbound
SN4
N
undetermined
westbound
SAdj3
network
direction
Saint-Basile
detour
9
Règles de transfert:
Français
Anglais
P→SN1+SN2
P’→SN1+SN2
Censément, il parait que les deux phrases présentent la même construction, surtout, au niveau
de la segmentation. Mais, des différences s’installent, au niveau de la structure de surface,
après l’achèvement de la traduction.
SN1→SN3+SConj
SN1→SAdj1+SN3
SN3→NE1
SAdj1→Adj+SConj
NE1→N+Adj
SConj→Conj+Adj
SConj→Conj+SAdj
SN3→NE
SAdj→NE2
NE→N+NP
NE2→Adj+NP
Le premier syntagme est composé de deux
Le premier syntagme est composé de deux
syntagmes : un syntagme adjectival et un
syntagmes : un syntagme nominal et un
syntagme nominal.
syntagme conjonctionnel.
Les syntagmes sont inversés. Alors l’ordre de
La traduction est réalisée suivant un modèle
syntagmes a changé.
de miroir, c.-à-d. réflexive, alors l’ordre des
SAdj1 est composé de Westbound (adjectif,
syntagmes sera inversé.
neutre, singulier) and (conjonction) qui lie
SN3 est composé d’un nom expansé
westbound à eastbound (adjectif, neutre,
« direction Ouest » construit de direction
singulier) qui complètent ensemble le nom
(nom commun, féminin, singulier) et de son
expansé « direction Saint-Basile » direction
complément « Ouest » (substantif, masculin,
(nom commun, neutre, singulier) et Saintsingulier). « Direction Ouest » est complété
Basile (nom propre, singulier, masculin).
par un syntagme conjonctionnel « et Est
Après la traduction, le nombre des éléments
Saint-Basile » et (conjonction), Est (adjectif,
constituants de SN1 reste inchangeable. La
invariable, neutre et n’a pas un pluriel) Saint- différence sera au niveau de la construction :
Basile (nom propre, singulier, masculin).
l’adjectif précède le nom en Anglais, au
contraire, en Français, le nom précède
l’adjectif. Alors l’ordre des adjectifs Est et
Ouest qui serait Westbound et Eastbound sera
inversé.
SN2→SN4+SN5
SN2→SAdj3+SAdj4
SN4→NE3
SAdj3→Adj+N
NE→N+Adj
SAdj4→Adj+SN4
SN5→N+NE4
SN4→N+N
NE4→N+Adj
Durée (nom commun, féminin, singulier) est
complétée par l’adjectif indéterminée
(adjectif, féminin, singulier). « Durée
indéterminée » constitue un nom expansé.
L’adjectif « indéterminée » constitué par
l’affixation, c’est l’ajout du préfixe « in » (qui
« undetermined period » est un nom expansé,
constitué d’un adjectif « undetermined »
(adjectif, neutre) conserve la même formation
morphologique du Français, qui est
l’affixation (« un » est un préfixe (qui sert à
changer le sens en antonyme du mot), qui
10
sert à changer le sens en antonyme du mot) à
l’adjectif « déterminée ».
« Détour » (nom commun, masculin,
singulier) est complété par « réseau local », et
constituent ensemble un syntagme nominal.
« réseau » (nom commun, masculin,
singulier) est suivi d’un adjectif « local »
(adjectif, masculin, singulier). L’adjectif local
est accordé au nom réseau. Et comme
d’habitude, l’adjectif suit le nom en Français.
précède l’adjectif « determined »). « period »
(nom commun, neutre) suit l’adjectif
« undetermined », à l’inverse du Français,
alors l’ordre des mots est par suite inversé.
L’ordre est encore inversé dans le reste du
syntagme : l’adjectif « local » (adjectif,
singulier, neutre) précède le nom « network »
(nom commun, singulier, neutre) et le nom
« detour » (nom commun, singulier, neutre).
La traduction de ce syntagme est encore
réflexive basée sur le changement d’ordre,
tout en gardant les mêmes éléments.
11
Phrase 3 :
Cause: Mesures préventives.
Analyse syntaxique :
Segmentation et regroupement en syntagmes :
Cause
N1
Mesures
N2
Préventives.
Adj
SN3
SN3
SN2
SN1
P
[P [SN1 [SN2 [N1]] +SN3 [N2+Adj]]]]
P’= Cause: Preventive measures.
P P’
SN1 SN1
SN2
Nom 1
Cause
SN2
SN3
Nom1
Nom 2
Adjectif
Cause
Mesures
préventives
SN3
Adjectif
Nom2
preventive measures
12
Règles de transfert:
Français
Anglais
P→SN1
P’→SN1
Censément, il parait que les deux phrases présentent la même construction, surtout, au niveau
de la segmentation. Mais, des différences s’installent, au niveau de la structure de surface,
après l’achèvement de la traduction.
SN1→SN2+SN3
SN1→SN2+SN3
SN2→N
SN2→N
SN3→N+Adj
SN3→Adj+N
La phrase est constituée de 2 syntagmes
principaux : le premier SN1 est constitué par
son tour, d’un nom « Cause » (nom commun,
féminin, singulier), suivi d’une ponctuation
« : » qui est utilisée pour fournir une
explication qui complète le nom cause.
Après la ponctuation, il y a le deuxième
syntagme « mesures préventives » constituée
d’un nom « mesures » (nom commun,
féminin, pluriel) suivi d’un adjectif
« préventives » (adjectif, féminin, pluriel).
L’adjectif s’accord avec le nom en genre et en
nombre, et en Français, généralement
l’adjectif suit le nom.
La phrase est constituée de 2 syntagmes
principaux : le premier SN1 est constitué par
son tour, d’un nom « Cause » (nom commun,
neutre, singulier), suivi d’une ponctuation
« : » qui est utilisée pour fournir une
explication qui complète le nom cause.
Après la ponctuation, il y a le deuxième
syntagme « preventive measures » constituée
d’un adjectif « preventive » (adjectif, neutre,
singulier) suivi d’un nom « measures » (nom
commun, neutre, pluriel).
L’adjectif ne s’accorde pas avec le nom en
nombre, et en Anglais, l’adjectif précède le
nom : c’est une inversion.
13
Remarques sur le Fuzzy Match :
1. On a essayé plusieurs logiciels pour réaliser la traduction : Trados avait besoin d’une
« Translation Memory » (Format : SDLTM) dont on ne possède pas, et il n’accèpte pas
les mémoires de format TMX. Alors que, « Mate cat » accepte les mémoires de type
TMX.
2. Le corpus a été traduit, à peu près, comme un tout : il a été segmenté en deux segments :
« Fermeture route Saint-Joseph entre le rang Saint-Joseph et la rivière Chaude., direction
OUEST et EST, Saint-Basile, durée indéterminée, détour réseau local » translaté en
«Closure of Saint-Joseph road between Saint-Joseph place and the Chaude river.,
westbound and eastbound direction, Saint-Basile, undetermined period, local network
detour ».
«Cause: Mesures préventives.» translaté en «Cause: Preventive measures.».
Le Fuzzy match est appliqué sur tout le corpus, et a présenté une valeur de 88%.
Le premier segment se termine par (.,) qui est considérée comme une faute en Anglais.
La mesure des segments est à peu près la même, entre les deux corpus (source, cible).
Au niveau de la troisième phrase, l’adjectif remplace le nom, lorsque la traduction est
réalisée. Ce que diminue le pourcentage de Fuzzy Match. Mais, en revanche, cette phrase
sera utile dans la mémoire de traduction, lorsqu’il s’agit de la traduction du même
segment, parce que l’ordre du nom et de l’adjectif changent seulement.
7. Il y a une grande ressemblance entre les « stop words » dans les deux langues, c.-à-d. les
prépositions et les conjonctions, exemple : « entre » et « between ».
8. Le « Substring matches » partiel était très grand, mais les différences s’installent dans les
microéléments constituants des noms expansés, dans la plupart du temps. (c’est
mentionné dans les règles de transferts).
9. L’ordre des mots change, en Français le nom commun précède le nom propre dans le
nom expansé comme dans « route Saint-Joseph » alors qu’en Anglais l’ordre sera inversé.
En plus, en Français, l’adjectif suit le nom, pourtant qu’en Anglais c’est le contraire,
comme « Chaude river » au lieu de « rivière chaude ».
10. Le format et le tagging sont les mêmes, sauf si l’ordre des mots change, à cause de
différences entre les deux langues, par exemple : « mesures préventives » devient
« preventive measures ».
11. Il faut mentionner qu’en Anglais, généralement, le genre est neutre, et l’accord de
l’adjectif n’est pas toujours obligatoire.
12. On a utilisé le terme neutre pour désigner que le mot n’a pas un genre, et ça n’a rien à
voir avec la connotation ou le sens du mot, s’il est mélioratif ou péjoratif.
3.
4.
5.
6.
14
Téléchargement