Offre de mobilité – Ingénieurs et techniciens
Institut national de la santé et de la recherche médicale
Ingénieur(e) en calcul scientifique
Profil de poste
Informatique, Statistique et Calcul Scientifique
U 830 Unité de génétique et biologie des cancers
L’ingénieur devra mettre en œuvre des méthodes dédiées à l’analyse numérique. Il utilisera,
développera et implémentera des outils bioinformatiques et statistiques facilitant l’exploitation
des données transcriptomiques et génomiques complexes générées par le laboratoire ou
accessible dans les bases de données publiques. Il mettra en œuvre des méthodes dédiées à
l’analyse et à l’exploitation de ces types de données variées. Il disposera d’une expérience
dans l’analyse de données RNA-Seq et des approches single-cell. Il améliorera les différents
algorithmes développés au sein de l’unité permettant l’automatisation des analyses d’images
de diverses natures (IHC, time-laps imaging on live-cell).
Développer des outils d’aide à l’analyse et à la visualisation de grand volume de données
issues de transcriptomes (microarrays) et de technologies NGS.
Assurer l’analyse statistique des données « omiques » (transcriptomiques, métabolomique,
protéomiques,…) générées par le laboratoire.
Assurer la veille technologique et scientifique des nouvelles méthodes et outils en
bioinformatique / statistique
Réaliser les analyses statistiques des différentes études et projets développées au sein de
l’unité.
Comprendre et à améliorer les différents algorithmes développés au sein de l’équipe
permettant l’automatisation des analyses d’images de diverses natures (IHC, time-laps
imaging on live-cell).
Présenter et communiquer les résultats en réunion, séminaires et sous forme d’articles
Participer à la formation des personnels de l’unité sur les nouveaux outils informatiques
disponibles
Bonne connaissances en biologie
Compétences et expériences en analyse de données transcriptomiques
Compétences et expériences en analyse de données NGS (RNA-Seq, ChiP-Seq)
Bonne maîtrise et expérience significative du langage R et des librairies associés
(Bioconductor)
Connaissance en statistique : statistiques descriptives, inférentielles (test d’hypothèses),
méthodes univariées et multivariées, analyse de survie, méthodes d’apprentissage
Bonne notions de programmation (C, Python, R…)
Connaissance des principales bases de données publiques et des plateformes
d’intégration de données (TCGA, cBioPortal,…)
Maitrise de R et de Bioconductor
Connaissance d’au moins un language de script (Python) et Bash
Savoir utiliser l’environnement Linux/Unix et un cluster de calcul