INTRODUCTION
Du 02 juin au 01 juillet 2014, j’ai effectué un stage au sein du laboratoire LIG,
Laboratoire d'Informatique de Grenoble. Au cours de ce stage avec l'équipe GETALP,
Groupe d'étude pour la traduction automatique et le traitement automatisé des langues
et de la parole , j’ai pu m’intéresser au traitement automatique des langues.
Plus largement, ce stage a été l’opportunité pour moi de decouvrir le monde de la
recherche. Il m'a aussi permis d'apprendre, de développer mes compétences en
matière de programmation, travail d'equipe etc.
Au-delà d’enrichir mes connaissances en informatique, il m’a permis de comprendre
dans quelle mesure le traitement automatique des langues est important.
Mon stage avec l'équipe GETALP a consisté essentiellement à définir une structure
pour le wiktionnaire bambara.
En effet, depuis plusieurs années, l'équipe GETALP du laboratoire LIG extrait des
données liées lexicales de différentes éditions du wiktionnaire (pendant
dictionnairique de wikipédia).
Ces données sont utilisées dans des applications de traitement des langues.
En ce moment, 12 éditions du wiktionnaire sont extraites, comprenant des mots, avec
leur définition et plus de 3 millions de traductions vers plus de 1000 langues.
Du côté du site wiktionary par contre, de nombreuses langues ne contiennent que très
peu de données, ou, sont non disponibles. C'est le cas de l'édition bambra du
wiktionary qui est acctuellement fermée alors que les autres éditions contiennent des
traductions vers des mots bambara.
Par ailleurs, de nouveaux dictionnaires de langues africaines ont été numérisés lors
d'un projet précédent. Parmi ceux-ci, un dictionnaire Bambara.
Le but de mon stage était d'intégrer les données de dictionnaires numérisés
du Bambara dans les données lexicales Dbnary, puis d'étudier les moyens de reverser
ces données sur le site Wiktionary afin d'animer une communauté qui le corrigera et
le fera grandir.
Dans l'objectif de rendre compte de manière fidèle et analytique des quatres semaines
passés au sein du laboratoire LIG, il m'a semblé essentiel de présenter
l'environnement dans lequel le stage s'est effectué, à savoir le laboratoire LIG.
Enfin, il sera précisé les différentes missions et tâches que j’ai pu effectuer au sein de
l'équipe GETALP, et les nombreux apports que j’ai pu en tirer.
Rapport de stage 4