IPoC : interprète de poche contextuel

publicité
P17. IPoC - Interprète de Poche Contextuel
Année 2004-2005
Encadrants : Mme MaryvonneABRAHAM, Mme Josette JOUAS, et M. Zongyang Wu
Partenaires : M. Philippe MORVAN, Société RDI+
Mots clés : traduction , logiciel, modélisation, corpus, grammaire, linguistique,
développement informatique, international, tourisme
Résumé :
L'objectif de ce projet est d'aider à concevoir un logiciel de traduction multilingue (7
langues traitées), en se basant sur un corpus de phrases lié au tourisme. L'utilisateur du
logiciel iPoC pourra construire les phrases qu'il souhaite traduire, à l'aide de blocs de mots.
Ces blocs correspondent à un modèle que nous avons établi selon les règles grammaticales
des différentes langues, tout en respectant un critère de simplicité. Une application de
démonstration sera accessible au public lors du Forum des 28 et 29 juin 2005.
1. Présentation et contexte du projet
La plupart des guides linguistiques touristiques, notamment les logiciels, proposent
des phrases toutes faites qu'il traduisent d'un seul tenant. Ceci n'est pas très pratique dans
la mesure où l'utilisateur ne peut exprimer ses besoins qu'avec ces phrases là, et est donc
limité dans ses choix. Par ailleurs, il ne comprend pas forcément la réponse de son
interlocuteur.
Notre partenaire industriel, M.Morvan, souhaite se démarquer des logiciels existants
en donnant la possibilité à l'utilisateur et à son interlocuteur de construire les phrases à
traduire, à l'aide de blocs de mots qu'il peut ajuster à sa guise. Plusieurs langues seront
traitées: Allemand, Anglais, Chinois, Espagnol, Français, Polonais et Roumain. Notre rôle
est de concevoir un modèle de blocs adapté à ces langues, et d' implémenter une
application de démonstration de la modélisation retenue.
2. Méthodologie développée pour aboutir.
Ce projet se divise en quatre étapes principales :
●
Elargissement et traduction dans 7 langues du corpus de phrases initial, fourni par
M.Morvan
● Elaboration d'un modèle de blocs, ou grammaire pivot, à partir des règles de grammaire
de chaque langue
● Développement d'une application test
● Organisation du Forum et de la soutenance finale
Pour mener à bien ces tâches, nous nous réunissions chaque semaine et effectuions
une répartition des tâches relativement homogène, chaque membre du groupe étant
responsable d'une langue traduite.
3. Développement des différentes tâches et principaux résultats.
31.
Elargissement et traduction du corpus de base en 7 langues.
Responsables: l'ensemble du groupe
L'agrandissement et la traduction du corpus ont été effectués avec le logiciel
Microsoft Excel. La majorité des traductions ont été faites par les membres du groupe, et
nous avons reçu l'aide de plusieurs personnes de nationalité étrangères sur le campus afin
de les vérifier et les corriger. Nous les remercions vivement.
Nous disposons désormais d'un corpus complet de 684 phrases, concernant 17 thèmes
couramment utilisés par les touristes.
32.
Elaboration d'un modèle de grammaire pivot
Responsables: l'ensemble du groupe
Pour concevoir notre modèle, nous avons tout d'abord retrié le corpus par structure
de phrases. Ces structures ont ensuite été analysées grammaticalement et syntaxiquement
dans chaque langue. Nous avons confronté par la suite nos analyses, et avons conçu un
modèle général, adaptable selon chaque langue moyennant parfois quelques petites
modifications. Nous avons alors développé les algorithmes de traduction à partir du modèle
de grammaire général.
33.
Implémentation informatique
Responsables techniques : l'ensemble du groupe
Responsable interface graphique : Marie-Cécile Caroff
Le développement informatique du logiciel de démonstration a été fait en Java, en
utilisant la plateforme de développement Eclipse (http://www.eclipse.org). Certains choix
techniques ont dû être faits, compte tenu des difficultés rencontrées lors du développement.
L'application réalisée correspond à nos attentes.
34.
Préparation du Forum
Responsable Forum : Lucile Billac
Cette tâche constitue l'achèvement du projet et représente surtout un travail de
rédaction (posters, publicité, triptyque) et d'organisation (stand, soutenance finale), en vue
du Forum des 28 et 29 juin 2005.
4. Conclusions et perspectives.
Le projet que nous avons mené a abouti à un logiciel de démonstration efficace et
ergonomique. Nous avons pu appréhender pleinement la richesse sémantique des
différentes langues et cultures mais également leurs différences et les difficultés
considérables des traductions multilingues, bien que notre projet concerne un thème
sémantique restreint (le tourisme).
Des évolutions et améliorations peuvent encore être apportées, notamment
concernant le traitement de la base de données, mais aussi l'ajout de la prononciation des
phrases, pour une maniabilité et une efficacité toujours plus grandes.
Bibliographie
[1] R.OGOR, R.RANNOU, A.BEUGNARD, J.LEDREZEN, P.GEFFROY :
« L'algorithmique, La modélisation objets, La Programmation objets, Les interfaces
graphiques par Le langage Java »
http://www.java.sun.com
Téléchargement