PDF (9,3 Mo) - Observatoire de linguistique Sens-Texte

Université de Montréal
Du terme prédicatif au cadre sémantique :
méthodologie de compilation d’une ressource terminologique pour
les termes arabes de l’informatique
par Nizar Ghazzawi
Département de linguistique et de traduction
Faculté des arts et des sciences
Thèse présentée
en vue de l’obtention du grade de Philosophiæ Doctor (Ph.D.)
en Traduction
option Terminologie
mai 2016
© Nizar Ghazzawi, 2016
Université de Montréal
Faculté des études supérieures
Cette thèse intitulée :
Du terme prédicatif au cadre sémantique :
méthodologie de compilation d’une ressource
terminologique pour les termes arabes de l’informatique
présentée par :
Nizar Ghazzawi
a été évaluée par un jury composé des personnes suivantes :
Patrick Drouin, Président du jury
Marie-Claude L‘Homme, Directrice de recherche
Fatiha Sadat, Co-directrice
Jean Quirion, Membre du jury
Mercè Lorente, Examinatrice externe
i
Résumé
La description des termes dans les ressources terminologiques traditionnelles se limite
à certaines informations, comme le terme (principalement nominal), sa définition et son
équivalent dans une langue étrangère. Cette description donne rarement d’autres informations
qui peuvent être très utiles pour l’utilisateur, surtout s’il consulte les ressources dans le but
d’approfondir ses connaissances dans un domaine de spécialité, maitriser la rédaction
professionnelle ou trouver des contextes le terme recherché est réalisé. Les informations
pouvant être utiles dans ce sens comprennent la description de la structure actancielle des
termes, des contextes provenant de sources authentiques et l’inclusion d’autres parties du
discours comme les verbes.
Les verbes et les noms déverbaux, ou les unités terminologiques prédicatives (UTP),
souvent ignorés par la terminologie classique, revêtent une grande importance lorsqu’il s’agit
d’exprimer une action, un processus ou un évènement. Or, la description de ces unités
nécessite un modèle de description terminologique qui rend compte de leurs particularités. Un
certain nombre de terminologues (Condamines 1993, Mathieu-Colas 2002, Gross et Mathieu-
Colas 2001 et L’Homme 2012, 2015) ont d’ailleurs proposé des modèles de description basés
sur différents cadres théoriques.
Notre recherche consiste à proposer une méthodologie de description terminologique
des UTP de la langue arabe, notamment l’arabe standard moderne (ASM), selon la théorie de
la Sémantique des cadres (Frame Semantics) de Fillmore (1976, 1977, 1982, 1985) et son
application, le projet FrameNet (Ruppenhofer et al. 2010). Le domaine de spécialité qui nous
intéresse est l’informatique. Dans notre recherche, nous nous appuyons sur un corpus recueilli
du web et nous nous inspirons d’une ressource terminologique existante, le DiCoInfo
(L’Homme 2008), pour compiler notre propre ressource. Nos objectifs se résument comme
suit. Premièrement, nous souhaitons jeter les premières bases d’une version en ASM de cette
ressource. Cette version a ses propres particularités : 1) nous visons des unités bien
spécifiques, à savoir les UTP verbales et déverbales; 2) la méthodologie développée pour la
compilation du DiCoInfo original devra être adaptée pour prendre en compte une langue
sémitique. Par la suite, nous souhaitons créer une version en cadres de cette ressource, où nous
ii
regroupons les UTP dans des cadres sémantiques, en nous inspirant du modèle de FrameNet.
À cette ressource, nous ajoutons les UTP anglaises et françaises, puisque cette partie du travail
a une portée multilingue.
La méthodologie consiste à extraire automatiquement les unités terminologiques
verbales et nominales (UTV et UTN), comme Ham~ala (ﻞﻤﺣ) (télécharger) et taHmiyl (ﻞﯿﻤﺤﺗ)
(téléchargement). Pour ce faire, nous avons adapté un extracteur automatique existant,
TermoStat (Drouin 2004). Ensuite, à l’aide des critères de validation terminologique
(L’Homme 2004), nous validons le statut terminologique d’une partie des candidats. Après la
validation, nous procédons à la création de fiches terminologiques, à l’aide d’un éditeur XML,
pour chaque UTV et UTN retenue. Ces fiches comprennent certains éléments comme la
structure actancielle des UTP et jusqu’à vingt contextes annotés. La dernière étape consiste à
créer des cadres sémantiques à partir des UTP de l’ASM. Nous associons également des UTP
anglaises et françaises en fonction des cadres créés. Cette association a mené à la création
d’une ressource terminologique appelée « DiCoInfo : A Framed Version ». Dans cette
ressource, les UTP qui partagent les mêmes propriétés sémantiques et structures actancielles
sont regroupées dans des cadres sémantiques. Par exemple, le cadre sémantique
Product_development regroupe des UTP comme Taw~ara (رﻮط) (développer), to develop
et développer.
À la suite de ces étapes, nous avons obtenu un total de 106 UTP ASM compilées dans
la version en ASM du DiCoInfo et 57 cadres sémantiques associés à ces unités dans la version
en cadres du DiCoInfo. Notre recherche montre que l’ASM peut être décrite avec la
méthodologie que nous avons mise au point.
Mots-clés : unité terminologique prédicative, cadre sémantique, FrameNet, informatique,
Arabe Standard Moderne, Frame Semantics
1 / 344 100%

PDF (9,3 Mo) - Observatoire de linguistique Sens-Texte

La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !