Ingénieur(e) en traitement Bioinformatique de données haut débit

publicité
Profil pour mobilité « Métier d’Avenir »
Ingénieur(e) en traitement Bioinformatique de données haut débit
Ingénieur(e) d’Etude
ou Ingénieur(e) de Recherches
Auvergne-Rhône-Alpes
UMR 1213 - Herbivores
Missions et Activités
L'ingénieur(e) en développement d'applications analyse, réalise et met en place des développements logiciels en
définissant des moyens matériels et logiciels en concertation avec le responsable de projet. Il/elle assure la
maintenance corrective et évolutive des applications.
L’ingénieur(e) en traitement Bioinformatique de données haut débit aura pour mission:
 le maintien et l'implémentation d'un webservice de fouille de données développé dans l'unité
(http://proteinside.org),
 la mise en oeuvre de stratégies et d'outils d'analyse de données de séquençage, de transcriptomique (et
metatranscriptomique) et de protéomique générées dans l'unité ou stockées dans des bases de données publiques,
 La mise en œuvre de stratégies et d’outil d’analyse pour recenser et qualifier les données et les rendre accessibles
au partage et à la ré-utilisation par les biologistes de l’unité ou de la communauté scientifique.
Les activités de l’ingénieur(e) accompagneront celles des scientifiques biologistes qui développent des approches de
text mining et de data mining pour contribuer aux défis de biologie prédictive et de l’open science afin d’obtenir des
phénotypages ou des prédictions efficaces et opérationnels.
Contexte et cadre de travail
Le département Phase a pour mission d'aider les élevages à évoluer vers la multiperformance, en mobilisant
simultanément les principes de l'agroécologie (stimulation des processus naturels) et les approches de la biologie
prédictive (modèles et outils d'aide au pilotage). Les recherches conduites à l’UMR1213 Herbivores (128 agents
permanents) contribuent aux cinq objectifs du Schéma Stratégique de Département (SSD) 2016-2020 du département
Phase : i) augmenter l'efficience et la robustesse des animaux et des systèmes, ii) limiter les intrants "à problème"
(certaines ressources alimentaires, hormones, antibiotiques), iii) diminuer les rejets polluants et valoriser tous ceux qui
peuvent l’être, iv) favoriser le bien-être et préserver la santé des animaux, v) maximiser les services rendus par
l’élevage. Elles génèrent notamment des données sur les phénotypes relatifs à l’efficience des ruminants, leurs
capacités adaptatives et robustesse, et la qualité des produits. Ces phénotypes sont caractérisés par l’analyse du
génome de l’animal hôte et de son expression, et par des analyses métagénomiques et métatranscriptomiques du
microbiote symbiotique. Les données sont acquises en collaboration avec différentes plateformes françaises (PFEM à
Theix, plateforme de protéomique de l’Institut H. Curien à Strasbourg, Génopole Ouest à Nantes, MetaQuant à Jouy-enJosas), et internationales (BGI en Chine, Roy J. Carver Biotechnology Center aux Etats-Unis, CSIRO en Australie et
AgResearch en Nouvelle-Zélande). Une exploitation optimale des données produites dans l’unité ou par la communauté
scientifique, nécessite des applications logicielles à développer et faire évoluer.
L'ingénieur(e) sera intégré(e) au pôle informatique de l'unité, où deux autres agents ont une formation initiale en
bioinformatique. Il/elle travaillera en assurant une interaction étroite avec les scientifiques des équipes de recherche
qui conduisent des projets de biologie intégrative pour caractériser les phénotypes d’intérêt (Biomarqueurs et Dinamic)
et les plateformes. La personne recrutée interagira avec l'Ingénieur gestionnaire des bases de données de l'unité, et
avec les membres du groupe Informatique scientifique du Centre Auvergne-Rhône-Alpes (lieu de partage d'expériences
de développeurs, bioinformaticiens et statisticiens). Au niveau régional, l'ingénieur(e) interagira avec des
bioinformaticiens des laboratoires de l'IFR Santé-Auvergne et du réseau Auvergne Bioinformatique. Sur le plan national,
l'ingénieur(e) sera un(e) correspondant(e) privilégié(e) entre le Centre et le réseau national SIGENAE. Il (elle) interagira
avec des bioinformaticiens du CATI BBRIC (Centre Automatisé de Traitement de l'Information BioInformatique,
Biodiversité, Représentation et Intégration des Connaissances) ou MIAGO (Mathématique et Informatique pour
l'Analyse des Génomes aux Organismes). Au niveau international, il (elle) sera impliqué(e) dans les recherches réalisées
en collaboration avec des bioinformaticiens du CSIRO et de l'Institut Suisse de Bioinformatique.
Ce profil ouvre droit à une prime informatique de niveau analyste si le (la) candidat(e) est déjà qualifié(e) à ce niveau.
Sinon, il/elle devra passer l’examen de qualification pour bénéficier de ladite prime.
Compétences
Il s’agit ici des compétences qui seront appelées à être développées tout ou partie, dans la mesure où le candidat ne les a
pas déjà.
Compétences cœur de métier :
o
o
o
o
o
o
Connaissance approfondie des méthodes et outils de fouille de données (data mining) et de statistiques liées aux
jeux de données massifs,
Maîtrise d'au moins deux des langages de script (Perl, Python,...) et du langage Linus Shell,
Maîtrise des langages et outils de développement web (Javascript, Boostrap, PHP...),
Maîtrise de système de gestion de bases de données SQL (mySQL, ...),
Maîtrise de l'environnement Linux, ainsi que la connaissance des stratégies de parallélisation
Connaissance générale de bibliothèques de programmes de calcul scientifique
Autres compétences :
o
o
o
o
o
o
o
Connaitre les architectures des ordinateurs et systèmes distribués et des systèmes d'exploitation
Connaitre l’environnement Galaxy
Travailler en interaction avec une ou plusieurs équipes de recherche
Maîtriser l’ensemble des méthodologies de la conduite de projet
Assurer l'organisation des données et le suivi de leur exploitation jusqu'à leur visualisation
Transmettre un certain nombre de savoir-faire techniques et méthodologiques en adaptant ses explications au
public concerné
Maitriser l’anglais : Expression écrite et orale : niveau 2 ; Compréhension écrite et orale : niveau 2
Profils
Il s’agit ici des profils indicatifs pour lesquels l’adaptation du candidat pour ce métier visé semble la plus aisée, mais dans
le cadre de ce dispositif « métiers d’avenir » toutes les candidatures seront étudiées avec attention.
Soit un(e) bioinformaticien(ne) de formation avec un intérêt pour la biologie. Soit un(e) biologiste avec une expérience
dans les domaines de la fouille de données « omics » et de l'analyse des données de séquençage à compléter par une
formation en bioinformatique et biostatistique.
Savoir être :
 Qualités relationnelles et capacité à travailler en équipe : interaction à la fois avec les biologistes de l'unité
d'accueil et les autres informaticiens et bioinformaticiens de l'Unité, du Département et de l’institut.
 Sens de l'organisation, rigueur et autonomie.
 Capacités à conduire plusieurs projets simultanément.
 Capacités à communiquer et rédiger.
Pour aller plus loin
Exemples de formations envisageables :
Master "Bio-Informatique et Génomique" de l'Université de Rennes 1 https://etudes.univ-rennes1.fr/master-biogeno/
Catalogues de formation INRA http://migale.jouy.inra.fr/?q=fr/formations et CNRS https://cnrsformation.cnrs.fr/listestages-65-Statistiques%2C-bioinformatique%2C-big-data.html
Réseau métier Inra (PEPI) sur Ingénierie Bioinformatique et Statistique pour les données haut-débit (IBIS)
http://www6.inra.fr/pepi/Ingenierie-Bio-Informatique-et-Statistique-pour-les-donnees-haut-debit-IBIS
Des informations relatives à la bioinformatique/informatique pour ce poste sont disponibles auprès de Matthieu
Reichstadt ([email protected])
 Modalités pour candidater
Transmettre une lettre de motivation, un CV et/ou votre dernière fiche carrière à : Muriel Bonnet et Milka
Popova
 Par e-mail : [email protected] et [email protected]
 Date limite pour postuler : 2 mai 2017
Dates envisagées pour l’entretien avec le comité de recrutement : 9 mai -19 mai 2017
Téléchargement