Les corpus comme outils d`aide à la traduction/Corpora as computer

publicité
Les corpus comme outils d'aide à la
traduction/Corpora as computer-assisted
translation tools
Journée d'étude à destination des étudiants de Master, Lundi 10 février 2014
Université C. de Gaulle – Lille 3 | UFR des LEA
14 Place Bodart Timal 59100 ROUBAIX
Amphi 2
9h15 Accueil des participant.e.s
9h30 Introduction
9h40 Cécile Frérot (Université de Grenoble)
Des corpus monolingues aux corpus parallèles dans l’enseignement de la traduction – Etude de cas sur le verbe introducteur de discours
say et ses équivalents français
10h20 Lore Vandevoorde (Université de Gand)
Do we begin in the same way as we start in translation? On the influence of translation and genre on the semantic structure of Dutch
inchoativity
11h00 Pause
11h10 Bert Cappelle (Université de Lille 3)
On using corpora to find out whether translations sound natural enough
11h50 Rudy Loock (Université de Lille 3)
Intra-language differences and translation quality
12h30 Pause déjeuner
14h30 Koen Plevoets (Université de Gand)
Informational load as a trigger for disfluencies in interpreting. A corpus-based regression analysis.
15h10 Carmen Nuñez-Lagos (Université de Lille 3)
Connecteurs, parataxe, hypotaxe et qualité dans les deux traductions françaises de Cinco horas con Mario (M. Delibes)
15h50 Pause
16h05 Lynn Prieels (Université de Gand)
Lexical variation in interlingual and intralingual audiovisual translation: A corpus-based multivariate study of Belgian Dutch subtitles
16h45 Fin de la journée
Informations : [email protected]
Plan d’accès : http://www.univ-lille3.fr/ufr-lea/venir-aux-lea/
Résumé des communications
Cécile Frérot | Des corpus monolingues aux corpus parallèles dans l’enseignement de la traduction – Etude de cas sur
le verbe introducteur de discours say et ses équivalents français
Notre communication porte sur l’utilisation de corpus et d’outils d’analyse de corpus dans le parcours universitaire
d’apprentis-traducteurs à travers l’élaboration d’un enseignement de L3 conçu comme un pré-requis à l’entrée en Master de
Traduction Spécialisée.
Nous présentons tout d’abord les corpus monolingues et comparables ainsi que les outils intégrés à notre enseignement puis
les activités proposées aux étudiants. Nous nous intéressons ensuite plus spécifiquement à l’exploitation de corpus parallèles à
travers une étude sur le verbe introducteur de discours « say » (ex. " I think I'll probably send my boys off, but I myself will
stay here," says a 50-year-old engineer) dont la traduction en français entraîne la surutilisation du verbe « dire » chez les
étudiants. Le corpus utilisé est constitué de textes du journal Le Monde accompagnés de leur traduction dans The Guardian
Weekly. L’analyse du corpus, qui montre la présence massive de « say » comme verbe introducteur de discours et fait
émerger une diversité de verbes en français (ex. déclarer, affirmer, expliquer, assurer), permet de sensibiliser les étudiants
aux différentes stratégies de traduction mises en oeuvre dans les textes et de contribuer de façon empirique à la formation
des apprentis-traducteurs.
Lore Vandevoorde | Do we begin in the same way as we start in translation? On the influence of translation and genre
on the semantic structure of Dutch inchoativity
How can we identify meaning? Is the meaning of a lexeme stable or could genre and translational status influence the possible
range of available senses of a lexeme? In order to understand the influence of translation and genre on the semantic structure
of a lexeme, we put forward a corpus-based method of back-and-forth translation that uses translational corpora to visualize
semantic structure in translated and non-translated genres. We apply this to the case of inchoativity in Dutch [BEGINNEN].
Bert Cappelle | On using corpora to find out whether translations sound natural enough
Do translators manage to think enough about, for instance, phrasal verbs when they translate from French into English? This
paper shows that there is a noticeable underrepresentation of such structures, for which there is no direct correlate in the
source language. This suggests that the average Fr-En translator cannot help but let the source language shine through in
translations. It is furthermore argued that the methodology demonstrated here could be extended to other areas of grammar.
In fact, nothing (but a bit of technical expertise) prevents us from finding out semi-automatically which typical differences
there are between translated and non-translated language.
Rudy Loock | Intra-language differences and translation quality
The aim of this presentation is to raise the question whether the measurement of intra-language differences between original
language and translated language can be used as a tool for translation quality assessment.
To ask such a question is to enter the thorny debate on the interpretation of intra-language differences: should we consider
translated language as variation comparable to dialectal variation or should we consider that the over-representation or
under-representation of a given linguistic construction means that the quality of the translation should be improved? From an
even more general perspective, should we consider that translated language is intrinsically different and represents what
researchers have called a third code or should we consider that “the utopian goal is to make it virtually impossible to tell the
translation from an original text in that language” (Teubert 1996: 241)?
Through the analysis of a learner corpus (translations tasks from English to French performed by first-year and master’s
students) for two case studies (derived adverbs and existential constructions), we try and see whether some correlation can
be found between observed intra-language differences and the overall quality of the translation tasks.
Informations : [email protected]
Plan d’accès : http://www.univ-lille3.fr/ufr-lea/venir-aux-lea/
Koen Plevoets | Informational load as a trigger for disfluencies in interpreting. A corpus-based regression analysis
This paper will analyse the relation between interpreting, informational load and disfluencies in a corpus of interpreted
language as compared to a corpus of spontaneous speech. The corpus of interpreted language was compiled at Ghent
University between 2010 and 2013. It consists of French, Spanish and Dutch interpreted speeches in the European Parliament
from 2006 until 2008. The audio fragments were transcribed according to the guidelines of the VALIBEL corpus (Bachy et al.
2007). For our purposes, a sub-corpus of French source speeches and their Dutch interpretations was selected, amounting to
a total corpus size of 140 000 words. The sub-corpus has additionally been annotated for lemmas, parts-of-speech and chunks
(Van de Kauter et al. 2013). The corpus which serves as the reference for spontaneous speech is the sub-corpus of political
debates of the Spoken Dutch Corpus (Oostdijk 2000). This sub-corpus contains 220 000 words of Netherlandic Dutch and 140
000 words of Belgian Dutch, which were collected between 1998 and 2003, and it is annotated for lemmas and parts-of speech.
Carmen Nuñez-Lagos | Connecteurs, parataxe, hypotaxe et qualité dans les deux traductions françaises de Cinco
horas con Mario (M. Delibes)
Il s’agit de rendre compte de la qualité des deux versions françaises du roman de M. Delibes (1966), l’une par A.-R. Monnier
(1988) et l’autre par D. Blanc (2010), au regard de l’utilisation des connecteurs ( et, mais, parce que, car…), de la parataxe et de
l’hypotaxe, stratégies linguistiques utilisées pour rendre compte notamment des énoncés espagnols construits avec le
connecteur que. Ces énoncés complexes (pluripropositionnels) avec que, omniprésents dans le roman espagnol, structurent le
récit et les idées du personnage principal, qui s’exprime sous forme d’un monologue composé de longs énoncés.
Nous présenterons une analyse quantitative et qualitative des procédés utilisés dans les deux traductions que nous
comparerons avec les résultats obtenus dans les travaux de traduction de ce même roman par les apprenants du Master TSM.
Nous mettrons en rapport le degré de condensation de l’information présente dans les traductions, c’est-à-dire le degré
d’intégration et de hiérarchisation des procès multiples en une seule énonciation (rapport entre le nombre de propositions
présentes et le nombre d’énoncés), avec la qualité de la traduction.
Lynn Prieels (Université de Gand) | Lexical variation in interlingual and intralingual audiovisual translation: A corpusbased multivariate study of Belgian Dutch subtitles
With this study, we investigate whether the lexical choices of translators, subtitlers and original authors differ significantly. In
order to achieve that goal, we gathered a set of linguistic variables and used a 500-million word balanced reference corpus
for contemporary (1954-present) written Dutch (the SoNaR corpus; Schuurman et al. 2010). By means of a profile-based
correspondence analysis (Plevoets, 2008), lexical distances between the translation and original varieties are measured and
visualized in a two-dimensional plot. The results indeed reveal significant differences between interlingual and intralingual
subtitles, between subtitles and written translations, and between subtitles and original texts. Influential variables explaining
the variation are speakers' status and translation type.
Informations : [email protected]
Plan d’accès : http://www.univ-lille3.fr/ufr-lea/venir-aux-lea/
Téléchargement