François Royer
06 72 33 75 02
TIC Valley
425, rue Jean Rostand
31670 Labège
Toulouse, le 17 décembre 2013
Objet: sujet de stage ingénieur / MII 2014
TRAITEMENT D'IMAGES SPATIALES SUR ARCHITECTURE “BIG DATA” -
APPROCHE PAR LA PROGRAMMATION FONCTIONNELLE
La programmation fonctionnelle présente aujourd'hui des avantages significatifs dans la conception
de chaînes de traitement dites “Big Data”. En effet les propriétés de composition et d'abstraction
liées aux langages fonctionnels en font des outils de choix pour le traitement de données massives.
Plusieurs grands acteurs du web ont adopté ces approches pour l'implémentation de leurs systèmes
de traitement (par ex: Yahoo/Hadoop, Twitter/Scala/Scalding).
Il est proposé dans ce stage d'appliquer ces approches au domaine du traitement d'images spatiales
(ex: MODIS) sur une architecture Hadoop. On mettra l'accent sur des abstractions simples
permettant de fusionner plusieurs sources de données ou d'effectuer des réanalyses sur séries
historiques exploitant les primitives de de type MapReduce.
Un premier travail de modélisation de données est attendu, afin d'évaluer le meilleur mode de
stockage d'images de grande taille (type de tuile, overlap...). Un deuxième volet sur
l'implémentation d'algorithmes de segmentation sous MapReduce sera ensuite mené.
Durée: 6 mois
Langage de programmation: Clojure (le stagiaire se formera au besoin au langage en début de stage)
Profil recherché: Java / programmation fonctionnelle (ex: Ocaml / Lisp / Scheme / Haskell / Erlang
ou Clojure), traitement d'images spatiales (algorithmie + implémentation), connaissance des formats
standards (GeoTIFF, HDF5...)
Datasio S.A.S au capital social de 10 000 euros – RCS Toulouse 753 266 584 – TVA FR 76 753 266 584