François Royer 06 72 33 75 02 TIC Valley 425, rue Jean Rostand 31670 Labège Toulouse, le 17 décembre 2013 Objet: sujet de stage ingénieur / MII 2014 TRAITEMENT D'IMAGES SPATIALES SUR ARCHITECTURE “BIG DATA” APPROCHE PAR LA PROGRAMMATION FONCTIONNELLE La programmation fonctionnelle présente aujourd'hui des avantages significatifs dans la conception de chaînes de traitement dites “Big Data”. En effet les propriétés de composition et d'abstraction liées aux langages fonctionnels en font des outils de choix pour le traitement de données massives. Plusieurs grands acteurs du web ont adopté ces approches pour l'implémentation de leurs systèmes de traitement (par ex: Yahoo/Hadoop, Twitter/Scala/Scalding). Il est proposé dans ce stage d'appliquer ces approches au domaine du traitement d'images spatiales (ex: MODIS) sur une architecture Hadoop. On mettra l'accent sur des abstractions simples permettant de fusionner plusieurs sources de données ou d'effectuer des réanalyses sur séries historiques exploitant les primitives de de type MapReduce. Un premier travail de modélisation de données est attendu, afin d'évaluer le meilleur mode de stockage d'images de grande taille (type de tuile, overlap...). Un deuxième volet sur l'implémentation d'algorithmes de segmentation sous MapReduce sera ensuite mené. Durée: 6 mois Langage de programmation: Clojure (le stagiaire se formera au besoin au langage en début de stage) Profil recherché: Java / programmation fonctionnelle (ex: Ocaml / Lisp / Scheme / Haskell / Erlang ou Clojure), traitement d'images spatiales (algorithmie + implémentation), connaissance des formats standards (GeoTIFF, HDF5...) Datasio S.A.S au capital social de 10 000 euros – RCS Toulouse 753 266 584 – TVA FR 76 753 266 584