biostatisticien-data scientist

publicité
Poste de biostatisticien/data scientist pour analyser les
données massives issues d’objets connectés en
épidémiologie (équipe "Générations et santé", E4N,
Inserm U1018, Villejuif)
Offre d'emploi. CDD 9 mois, possibilité de CDI derrière. Val de Marne.
Employeur
CESP, Équipe Générations et Santé, E4N, UMR-S 1018
Gustave Roussy, 114, rue Edouard Vaillant, 94805 Villejuif Cedex
http://www.e4n.fr
Le programme de recherche de l’équipe « Générations et santé » de l’unité Inserm U1018 est
centré sur l'approche épidémiologique de la relation entre le mode de vie, la génétique et le
risque des principales maladies chroniques chez la femme, à partir des données de l’enquête
E3N (www.e3n.fr). E3N est une enquête de cohorte à laquelle participent environ 100 000
femmes volontaires adhérentes à la Mutuelle Générale de l’Education Nationale (MGEN).
Les informations concernant d’une part leur mode de vie (alimentation, prise de traitements
hormonaux…) et d’autre part l’évolution de leur état de santé et en particulier la survenue de
cancer, sont recueillies par auto-questionnaires tous les 2 ans depuis 1990. Elles sont
complétées par des données biologiques stockées à des fins de dosages ultérieurs (études castémoins dans la cohorte). Plus récemment la cohorte E4N (www.e4n.fr) a été mise en place et
vise à prolonger l’étude E3N en suivant les conjoints et les descendants des femmes de l’étude
E3N. L’objectif est de mieux comprendre, dans l’apparition des maladies, ce qui relève de la
part génétique, de l’environnement familial et de l’environnement extra-familial. L’équipe est
également au cœur de la réflexion autour de la e-épidémiologie. En effet, la validation,
l’exploitation et l’évaluation des objets connectés à des fins d’utilisation en épidémiologie est
l’un des axes de recherche majeurs.
Description du poste
Environnement du poste
Le candidat intégrera l’équipe au sein du pôle biostatistiques. Il travaillera en collaboration
avec des chercheurs en épidémiologie, sera encadré par le responsable du pôle biostatistiques,
travaillera en collaboration avec 4 autres biostatisticiens, des data-managers et informaticiens.
L’animation scientifique au sein de l’équipe et du Centre de recherche en Epidémiologie et
Santé des Populations (CESP) à laquelle elle est rattachée comprend un partage de
connaissances dans les domaines des méthodes en épidémiologie et biostatistiques. En outre,
la personne recrutée pourra bénéficier de formations dans ces mêmes domaines proposées par
l’Inserm et de l’animation scientifique (département de biostatistiques) de l’Institut Gustave
Roussy qui héberge l’équipe.
Missions
 Développement méthodologique pour la prédiction d’événement de santé : méthodes
d’apprentissage supervisé sur données massives issues de traqueurs d’activité.
 Application de la méthode « k-NN » (k-nearest neighbors) sur des données issues
d’objets connectés Withings et dans la cohorte E4N.
 Création de scores prédictifs à partir de données de traqueurs d’activité
 Rédaction de rapports d’analyses
 Participation à la rédaction/relecture des articles scientifiques (en anglais)
 Soutien méthodologique en statistiques
Profil recherché : débutants acceptés
Profil


Bac +5 Biostatistiques ou Big data (data scientist) (ENSAI, ISUP, ISPED, M2
biostatistiques, Formations Big Data…)
Débutants acceptés, mais une 1ère expérience professionnelle réussie dans les
domaines des biostatistiques ou des Big Data sera fortement appréciée.
Compétences
 Bonne connaissance en statistiques des méthodes multivariées d’analyse de données
(modèles de Cox, mixtes, linéaires, logistiques)
 Expérience en data-mining (k-nn, machine learning,…), méthodes d’exploration,
segmentation, classification fortement appréciée
 Maîtrise des logiciels statistiques SAS (base et macro) et/ou R
 Bonne compréhension de l'anglais scientifique.
Qualités
 Sens de l’organisation et rigueur
 Aptitude à travailler en équipe
 Qualités rédactionnelles
 Autonomie, esprit d’initiative et esprit critique
 Capacité à gérer des projets multiples, à maitriser des délais, à s'adapter aux différents
interlocuteurs
Contrat à durée déterminée (CDD)
Au minimum, CDD de 9 mois. Possibilité de CDI de droit privé derrière. Rémunération selon
grille et en fonction de l’expérience. Recrutement possible à partir de mars/avril 2016.
Modalités de candidature
Envoyer CV et lettre de motivation par mail à Guy Fagherazzi, chercheur épidémiologiste :
[email protected]
Téléchargement