Poste de biostatisticien/data scientist pour analyser les données massives issues d’objets connectés en épidémiologie (équipe "Générations et santé", E4N, Inserm U1018, Villejuif) Offre d'emploi. CDD 9 mois, possibilité de CDI derrière. Val de Marne. Employeur CESP, Équipe Générations et Santé, E4N, UMR-S 1018 Gustave Roussy, 114, rue Edouard Vaillant, 94805 Villejuif Cedex http://www.e4n.fr Le programme de recherche de l’équipe « Générations et santé » de l’unité Inserm U1018 est centré sur l'approche épidémiologique de la relation entre le mode de vie, la génétique et le risque des principales maladies chroniques chez la femme, à partir des données de l’enquête E3N (www.e3n.fr). E3N est une enquête de cohorte à laquelle participent environ 100 000 femmes volontaires adhérentes à la Mutuelle Générale de l’Education Nationale (MGEN). Les informations concernant d’une part leur mode de vie (alimentation, prise de traitements hormonaux…) et d’autre part l’évolution de leur état de santé et en particulier la survenue de cancer, sont recueillies par auto-questionnaires tous les 2 ans depuis 1990. Elles sont complétées par des données biologiques stockées à des fins de dosages ultérieurs (études castémoins dans la cohorte). Plus récemment la cohorte E4N (www.e4n.fr) a été mise en place et vise à prolonger l’étude E3N en suivant les conjoints et les descendants des femmes de l’étude E3N. L’objectif est de mieux comprendre, dans l’apparition des maladies, ce qui relève de la part génétique, de l’environnement familial et de l’environnement extra-familial. L’équipe est également au cœur de la réflexion autour de la e-épidémiologie. En effet, la validation, l’exploitation et l’évaluation des objets connectés à des fins d’utilisation en épidémiologie est l’un des axes de recherche majeurs. Description du poste Environnement du poste Le candidat intégrera l’équipe au sein du pôle biostatistiques. Il travaillera en collaboration avec des chercheurs en épidémiologie, sera encadré par le responsable du pôle biostatistiques, travaillera en collaboration avec 4 autres biostatisticiens, des data-managers et informaticiens. L’animation scientifique au sein de l’équipe et du Centre de recherche en Epidémiologie et Santé des Populations (CESP) à laquelle elle est rattachée comprend un partage de connaissances dans les domaines des méthodes en épidémiologie et biostatistiques. En outre, la personne recrutée pourra bénéficier de formations dans ces mêmes domaines proposées par l’Inserm et de l’animation scientifique (département de biostatistiques) de l’Institut Gustave Roussy qui héberge l’équipe. Missions Développement méthodologique pour la prédiction d’événement de santé : méthodes d’apprentissage supervisé sur données massives issues de traqueurs d’activité. Application de la méthode « k-NN » (k-nearest neighbors) sur des données issues d’objets connectés Withings et dans la cohorte E4N. Création de scores prédictifs à partir de données de traqueurs d’activité Rédaction de rapports d’analyses Participation à la rédaction/relecture des articles scientifiques (en anglais) Soutien méthodologique en statistiques Profil recherché : débutants acceptés Profil Bac +5 Biostatistiques ou Big data (data scientist) (ENSAI, ISUP, ISPED, M2 biostatistiques, Formations Big Data…) Débutants acceptés, mais une 1ère expérience professionnelle réussie dans les domaines des biostatistiques ou des Big Data sera fortement appréciée. Compétences Bonne connaissance en statistiques des méthodes multivariées d’analyse de données (modèles de Cox, mixtes, linéaires, logistiques) Expérience en data-mining (k-nn, machine learning,…), méthodes d’exploration, segmentation, classification fortement appréciée Maîtrise des logiciels statistiques SAS (base et macro) et/ou R Bonne compréhension de l'anglais scientifique. Qualités Sens de l’organisation et rigueur Aptitude à travailler en équipe Qualités rédactionnelles Autonomie, esprit d’initiative et esprit critique Capacité à gérer des projets multiples, à maitriser des délais, à s'adapter aux différents interlocuteurs Contrat à durée déterminée (CDD) Au minimum, CDD de 9 mois. Possibilité de CDI de droit privé derrière. Rémunération selon grille et en fonction de l’expérience. Recrutement possible à partir de mars/avril 2016. Modalités de candidature Envoyer CV et lettre de motivation par mail à Guy Fagherazzi, chercheur épidémiologiste : [email protected]