Université Joseph Fourier
Département Licence Sciences & Technologies
RAPPORT DE STAGE
____________________________________________
TRAITEMENT AUTOMATIQUE DES LANGUES
THIAM Amadou Yoro
Laboratoire d'acceuil : Laboratoire d'Informatique de Grenoble - LIG
Directeur du laboratoire : HERVÉ Martin
Responsable de stage : SÉRASSET Gilles
L1 Mention Sciences et Technologies (Valence)
Parcours : Mathématique et Informatique
Année Universitaire : 2013 – 2014
Rapport de stage 1
Sommaire
Remerciements 3
Introduction 4
I / Environnement du stage: 5
1. Présentation 5
2. Domaines de recherches 5
3. Description de la structure sociale 5
II / Les travaux effectués et les apports du stage 7
A Les travaux effectués 7
1. Les outils mis à ma disposition 7
2. Les Missions du poste occupé 7
B – Les apports du stage 10
Conclusion 11
Annexes 12
Rapport de stage 2
REMERCIEMENTS
Je tiens à remercier tout d’abord l’Université Joseph Fourier (Site de Valence)
de m’avoir donné l’opportunité de découvrir le milieu de la recherche grâce au
dispositif des stages d’excellence.
Je remercie Marie-cecile DARRACQ-CALMETTES et Nina MANDON pour
m'avoir aidé à trouver ce stage et pour leur accompagnement dans les
démarches administratives.
Je remercie particulièrement Gilles SERRASET, mon maiître de stage, pour son
encadrement au cours de ce stage, ses conseils ainsi que son enseignement qui
m'ont beaucoup apporté.
Rapport de stage 3
INTRODUCTION
Du 02 juin au 01 juillet 2014, j’ai effectué un stage au sein du laboratoire LIG,
Laboratoire d'Informatique de Grenoble. Au cours de ce stage avec l'équipe GETALP,
Groupe d'étude pour la traduction automatique et le traitement automatisé des langues
et de la parole , j’ai pu m’intéresser au traitement automatique des langues.
Plus largement, ce stage a été l’opportunité pour moi de decouvrir le monde de la
recherche. Il m'a aussi permis d'apprendre, de développer mes compétences en
matière de programmation, travail d'equipe etc.
Au-delà d’enrichir mes connaissances en informatique, il m’a permis de comprendre
dans quelle mesure le traitement automatique des langues est important.
Mon stage avec l'équipe GETALP a consisté essentiellement à définir une structure
pour le wiktionnaire bambara.
En effet, depuis plusieurs années, l'équipe GETALP du laboratoire LIG extrait des
données liées lexicales de différentes éditions du wiktionnaire (pendant
dictionnairique de wikipédia).
Ces données sont utilisées dans des applications de traitement des langues.
En ce moment, 12 éditions du wiktionnaire sont extraites, comprenant des mots, avec
leur définition et plus de 3 millions de traductions vers plus de 1000 langues.
Du côté du site wiktionary par contre, de nombreuses langues ne contiennent que très
peu de données, ou, sont non disponibles. C'est le cas de l'édition bambra du
wiktionary qui est acctuellement fermée alors que les autres éditions contiennent des
traductions vers des mots bambara.
Par ailleurs, de nouveaux dictionnaires de langues africaines ont été numérisés lors
d'un projet précédent. Parmi ceux-ci, un dictionnaire Bambara.
Le but de mon stage était d'intégrer les données de dictionnaires numérisés
du Bambara dans les données lexicales Dbnary, puis d'étudier les moyens de reverser
ces données sur le site Wiktionary afin d'animer une communauté qui le corrigera et
le fera grandir.
Dans l'objectif de rendre compte de manière fidèle et analytique des quatres semaines
passés au sein du laboratoire LIG, il m'a semblé essentiel de présenter
l'environnement dans lequel le stage s'est effectué, à savoir le laboratoire LIG.
Enfin, il sera précisé les différentes missions et tâches que j’ai pu effectuer au sein de
l'équipe GETALP, et les nombreux apports que j’ai pu en tirer.
Rapport de stage 4
I / Environnement du stage :
Laboratoire d'Informatique de Grenoble – LIG :
1. Présentation:
Situé sur le campus de Grenoble, le laboratoire d'informatique de Grenoble(LIG) est
un laboratoire de recherche français en informatique, créé le 1er janvier 2007.
Ce laboratoire est sous la tutelle conjointe de l'université Joseph-Fourier - Grenoble
1, de l'université Pierre-Mendès-France - Grenoble II, de l'Institut Polytechnique de
Grenoble, du CNRS. Il est partenaire de l'INRIA.
Aujourd'hui, le LIG compte vingt-trois équipes de recherche (dont GETALP) et il
rassemble près de 500 chercheurs, enseignants-chercheurs, doctorants et personnels
en support à la recherche.
2. Domaines de recherches:
Les activités de recherche du laboratoire d'informatique de Grenoble couvrent de
nombreux domaines de l'informatique.
Les cinq axes thématiques de recherche explorés au LIG :
- Génie des Logiciels et des Systèmes d’Information ;
- Méthodes Formelles, Modèles et Langages ;
- Systèmes Interactifs et Cognitifs ;
- Systèmes Répartis, Calcul Parallèle et Réseaux ;
- Traitement de Données et de Connaissances à Grande Echelle.
3. Description de la structure sociale:
Les chercheurs du laboratoire sont divisés en vingt-trois équipes de recherches:
ADELE : Environnements et outils pour le Génie Logiciel Industriel ;
AMA : Apprentissage : modèles et algorithmes ;
CAPP : Calculs algorithmes programmes et preuves ;
DRAKKAR : Réseaux et Multimédia ;
E-MOTION : Géométrie et probabilité pour le mouvement et l'action ;
EXMO : Computer mediated exchange of structured knowledge ;
GETALP : Groupe d'étude pour la traduction automatique et le
traitement automatisé des langues et de la parole ;
HADAS : Heterogenous autonomous distributed data services ;
IIHM : Ingénierie de l'interaction homme-machine ;
MAGMA : Modélisation d’agents autonomes en univers multi-agents ;
Rapport de stage 5
1 / 20 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !