CMAPP_Analyste programmeur-RP

publicité
Secrétariat général
Service des ressources humaines, des emplois et des compétences
08/01/2015
FICHE DE POSTE
INTITULE DU POSTE
Analyste programmeur en technologies Big Data (H/F)
DESCRIPTIF
Emploi :
Famille professionnelle :
Analyste programmeur
Informatique et télécommunications
CONTEXTE
Établissement public et administratif (EPA) à vocation scientifique d’enseignement supérieur, de
recherche et d’innovation de réputation mondiale, l’Ecole Polytechnique développe de façon
intensive son activité autour de la Science des données et du Big Data. De nombreux projets de
recherche sur ces thématiques sont déjà en cours, ceux-ci fédérent plusieurs laboratoires de
recherche (notamment ceux de Mathématiques Appliquées et d’Informatique).
Dans le cadre d’un partenariat entre L’Ecole Polytechnique et la Caisse Nationale d’Assurance
Maladie (CNAM), l’Ecole Polytechnique recrute un analyste programmeur spécialiste de
technologies Big Data. Le partenariat porte sur l’étude statistique de la base données principale de
la CNAM (la base de données SNIIRAM). Cette base enregistre la nature précise (soins, achats de tel
ou tel médicament, etc.) et les montants de toutes les transactions remboursées aux assurés sociaux
(plus de 60 millions d’individus). Il s’agit de l’une des plus importantes bases de données santé du
monde (près de 1000 To de données). Le partenariat porte sur des sujets avec des impacts sociétaux
très forts tant d’un point de vue médical que d’un point de vue économique (la CNAM représente un
des tous premiers budgets de l’Etat Français).
La personne recrutée rejoindra l’équipe de Mathématiciens et Informaticiens de l’Ecole
Polytechnique (9 personnes actuellement) déjà engagés aujourd’hui dans ce partenariat.
DESCRIPTION DU POSTE
Mission principale :
Le titulaire du poste participe au développement informatique lié au partenariat entre l’Ecole
Polytechnique et la CNAM. Il s’agit essentiellement, dans un premier temps, de participer à une
restructuration de la base afin de l’alléger (suppression de la redondance et d’informations non
nécessaires aux études statiques) et de la porter vers une solution noSQL. Dans un second temps,
elle sera amenée à participer au portage de techniques innovantes de machine learning sur des
plateformes de cloud comptuting (hadoop, spark, etc.).
Il travaille en étroite collaboration avec le laboratoire de Mathématiques Appliquées (CMAP) et celui
d’Informatique (LIX).
Activités :
• Design et maintenance de database relationnelle (sql) de grande taille/complexité
• Design et maintenance de database no-sql de grande taille/complexité
• Preprocessing et nettoyage de gros volumes de données
• Développement des dernières techniques en big-data et cloud computing (map-reduce,
hadoop, spark, pig, etc.)
1/2
Secrétariat général
Service des ressources humaines, des emplois et des compétences
08/01/2015
Niveau recherché
Compétences
Savoirs
- Connaître le langage SQL
- Savoir intégrer la base de données noSql
- Connaître au moins une des dernières technologies en big-data
(map-reduce, hadoop, spark, pig,…)
S
Savoir faire
- Savoir designer et maintenir une base de données SQL de
grande taille.
- Savoir développer et optimiser les requêtes de bases de
données SQL et noSQL (de grande taille).
- Savoir manipuler une base de données SQL.
- Savoir pré-processer et nettoyer de grands volumes de
données.
- Savoir recueillir, analyser et synthétiser des informations.
Savoir être
- Avoir l’esprit d’équipe
- Être autonome
- Être réactif
- Être rigoureux/organisé
S
A
M
E
X
X
X
A
M
E
X
X
X
X
X
1
2
3
4
X
X
X
X
PROFIL
Titulaire d’un diplôme dans le domaine, équivalent Master 1 ou Master 2 (bac + 4 ou 5) ou grande
école, école d’ingénieur en informatique, avec formation en bases de données, systèmes, sciences et
technologies.
LOCALISATION DU POSTE
Ecole Polytechnique à Palaiseau (91)
Service demandeur
Service : Direction Enseignement et recherche
Département de Mathématiques Appliquées
Emmanuel BACRY
[email protected]
2/2
Téléchargement