Les corpus comme outils d'aide à la traduction/Corpora as computer-assisted translation tools Journée d'étude à destination des étudiants de Master, Lundi 10 février 2014 Université C. de Gaulle – Lille 3 | UFR des LEA 14 Place Bodart Timal 59100 ROUBAIX Amphi 2 9h15 Accueil des participant.e.s 9h30 Introduction 9h40 Cécile Frérot (Université de Grenoble) Des corpus monolingues aux corpus parallèles dans l’enseignement de la traduction – Etude de cas sur le verbe introducteur de discours say et ses équivalents français 10h20 Lore Vandevoorde (Université de Gand) Do we begin in the same way as we start in translation? On the influence of translation and genre on the semantic structure of Dutch inchoativity 11h00 Pause 11h10 Bert Cappelle (Université de Lille 3) On using corpora to find out whether translations sound natural enough 11h50 Rudy Loock (Université de Lille 3) Intra-language differences and translation quality 12h30 Pause déjeuner 14h30 Koen Plevoets (Université de Gand) Informational load as a trigger for disfluencies in interpreting. A corpus-based regression analysis. 15h10 Carmen Nuñez-Lagos (Université de Lille 3) Connecteurs, parataxe, hypotaxe et qualité dans les deux traductions françaises de Cinco horas con Mario (M. Delibes) 15h50 Pause 16h05 Lynn Prieels (Université de Gand) Lexical variation in interlingual and intralingual audiovisual translation: A corpus-based multivariate study of Belgian Dutch subtitles 16h45 Fin de la journée Informations : [email protected] Plan d’accès : http://www.univ-lille3.fr/ufr-lea/venir-aux-lea/ Résumé des communications Cécile Frérot | Des corpus monolingues aux corpus parallèles dans l’enseignement de la traduction – Etude de cas sur le verbe introducteur de discours say et ses équivalents français Notre communication porte sur l’utilisation de corpus et d’outils d’analyse de corpus dans le parcours universitaire d’apprentis-traducteurs à travers l’élaboration d’un enseignement de L3 conçu comme un pré-requis à l’entrée en Master de Traduction Spécialisée. Nous présentons tout d’abord les corpus monolingues et comparables ainsi que les outils intégrés à notre enseignement puis les activités proposées aux étudiants. Nous nous intéressons ensuite plus spécifiquement à l’exploitation de corpus parallèles à travers une étude sur le verbe introducteur de discours « say » (ex. " I think I'll probably send my boys off, but I myself will stay here," says a 50-year-old engineer) dont la traduction en français entraîne la surutilisation du verbe « dire » chez les étudiants. Le corpus utilisé est constitué de textes du journal Le Monde accompagnés de leur traduction dans The Guardian Weekly. L’analyse du corpus, qui montre la présence massive de « say » comme verbe introducteur de discours et fait émerger une diversité de verbes en français (ex. déclarer, affirmer, expliquer, assurer), permet de sensibiliser les étudiants aux différentes stratégies de traduction mises en oeuvre dans les textes et de contribuer de façon empirique à la formation des apprentis-traducteurs. Lore Vandevoorde | Do we begin in the same way as we start in translation? On the influence of translation and genre on the semantic structure of Dutch inchoativity How can we identify meaning? Is the meaning of a lexeme stable or could genre and translational status influence the possible range of available senses of a lexeme? In order to understand the influence of translation and genre on the semantic structure of a lexeme, we put forward a corpus-based method of back-and-forth translation that uses translational corpora to visualize semantic structure in translated and non-translated genres. We apply this to the case of inchoativity in Dutch [BEGINNEN]. Bert Cappelle | On using corpora to find out whether translations sound natural enough Do translators manage to think enough about, for instance, phrasal verbs when they translate from French into English? This paper shows that there is a noticeable underrepresentation of such structures, for which there is no direct correlate in the source language. This suggests that the average Fr-En translator cannot help but let the source language shine through in translations. It is furthermore argued that the methodology demonstrated here could be extended to other areas of grammar. In fact, nothing (but a bit of technical expertise) prevents us from finding out semi-automatically which typical differences there are between translated and non-translated language. Rudy Loock | Intra-language differences and translation quality The aim of this presentation is to raise the question whether the measurement of intra-language differences between original language and translated language can be used as a tool for translation quality assessment. To ask such a question is to enter the thorny debate on the interpretation of intra-language differences: should we consider translated language as variation comparable to dialectal variation or should we consider that the over-representation or under-representation of a given linguistic construction means that the quality of the translation should be improved? From an even more general perspective, should we consider that translated language is intrinsically different and represents what researchers have called a third code or should we consider that “the utopian goal is to make it virtually impossible to tell the translation from an original text in that language” (Teubert 1996: 241)? Through the analysis of a learner corpus (translations tasks from English to French performed by first-year and master’s students) for two case studies (derived adverbs and existential constructions), we try and see whether some correlation can be found between observed intra-language differences and the overall quality of the translation tasks. Informations : [email protected] Plan d’accès : http://www.univ-lille3.fr/ufr-lea/venir-aux-lea/ Koen Plevoets | Informational load as a trigger for disfluencies in interpreting. A corpus-based regression analysis This paper will analyse the relation between interpreting, informational load and disfluencies in a corpus of interpreted language as compared to a corpus of spontaneous speech. The corpus of interpreted language was compiled at Ghent University between 2010 and 2013. It consists of French, Spanish and Dutch interpreted speeches in the European Parliament from 2006 until 2008. The audio fragments were transcribed according to the guidelines of the VALIBEL corpus (Bachy et al. 2007). For our purposes, a sub-corpus of French source speeches and their Dutch interpretations was selected, amounting to a total corpus size of 140 000 words. The sub-corpus has additionally been annotated for lemmas, parts-of-speech and chunks (Van de Kauter et al. 2013). The corpus which serves as the reference for spontaneous speech is the sub-corpus of political debates of the Spoken Dutch Corpus (Oostdijk 2000). This sub-corpus contains 220 000 words of Netherlandic Dutch and 140 000 words of Belgian Dutch, which were collected between 1998 and 2003, and it is annotated for lemmas and parts-of speech. Carmen Nuñez-Lagos | Connecteurs, parataxe, hypotaxe et qualité dans les deux traductions françaises de Cinco horas con Mario (M. Delibes) Il s’agit de rendre compte de la qualité des deux versions françaises du roman de M. Delibes (1966), l’une par A.-R. Monnier (1988) et l’autre par D. Blanc (2010), au regard de l’utilisation des connecteurs ( et, mais, parce que, car…), de la parataxe et de l’hypotaxe, stratégies linguistiques utilisées pour rendre compte notamment des énoncés espagnols construits avec le connecteur que. Ces énoncés complexes (pluripropositionnels) avec que, omniprésents dans le roman espagnol, structurent le récit et les idées du personnage principal, qui s’exprime sous forme d’un monologue composé de longs énoncés. Nous présenterons une analyse quantitative et qualitative des procédés utilisés dans les deux traductions que nous comparerons avec les résultats obtenus dans les travaux de traduction de ce même roman par les apprenants du Master TSM. Nous mettrons en rapport le degré de condensation de l’information présente dans les traductions, c’est-à-dire le degré d’intégration et de hiérarchisation des procès multiples en une seule énonciation (rapport entre le nombre de propositions présentes et le nombre d’énoncés), avec la qualité de la traduction. Lynn Prieels (Université de Gand) | Lexical variation in interlingual and intralingual audiovisual translation: A corpusbased multivariate study of Belgian Dutch subtitles With this study, we investigate whether the lexical choices of translators, subtitlers and original authors differ significantly. In order to achieve that goal, we gathered a set of linguistic variables and used a 500-million word balanced reference corpus for contemporary (1954-present) written Dutch (the SoNaR corpus; Schuurman et al. 2010). By means of a profile-based correspondence analysis (Plevoets, 2008), lexical distances between the translation and original varieties are measured and visualized in a two-dimensional plot. The results indeed reveal significant differences between interlingual and intralingual subtitles, between subtitles and written translations, and between subtitles and original texts. Influential variables explaining the variation are speakers' status and translation type. Informations : [email protected] Plan d’accès : http://www.univ-lille3.fr/ufr-lea/venir-aux-lea/