Profil pour mobilité « Métier d’Avenir » Ingénieur(e) en traitement Bioinformatique de données haut débit Ingénieur(e) d’Etude ou Ingénieur(e) de Recherches Auvergne-Rhône-Alpes UMR 1213 - Herbivores Missions et Activités L'ingénieur(e) en développement d'applications analyse, réalise et met en place des développements logiciels en définissant des moyens matériels et logiciels en concertation avec le responsable de projet. Il/elle assure la maintenance corrective et évolutive des applications. L’ingénieur(e) en traitement Bioinformatique de données haut débit aura pour mission: le maintien et l'implémentation d'un webservice de fouille de données développé dans l'unité (http://proteinside.org), la mise en oeuvre de stratégies et d'outils d'analyse de données de séquençage, de transcriptomique (et metatranscriptomique) et de protéomique générées dans l'unité ou stockées dans des bases de données publiques, La mise en œuvre de stratégies et d’outil d’analyse pour recenser et qualifier les données et les rendre accessibles au partage et à la ré-utilisation par les biologistes de l’unité ou de la communauté scientifique. Les activités de l’ingénieur(e) accompagneront celles des scientifiques biologistes qui développent des approches de text mining et de data mining pour contribuer aux défis de biologie prédictive et de l’open science afin d’obtenir des phénotypages ou des prédictions efficaces et opérationnels. Contexte et cadre de travail Le département Phase a pour mission d'aider les élevages à évoluer vers la multiperformance, en mobilisant simultanément les principes de l'agroécologie (stimulation des processus naturels) et les approches de la biologie prédictive (modèles et outils d'aide au pilotage). Les recherches conduites à l’UMR1213 Herbivores (128 agents permanents) contribuent aux cinq objectifs du Schéma Stratégique de Département (SSD) 2016-2020 du département Phase : i) augmenter l'efficience et la robustesse des animaux et des systèmes, ii) limiter les intrants "à problème" (certaines ressources alimentaires, hormones, antibiotiques), iii) diminuer les rejets polluants et valoriser tous ceux qui peuvent l’être, iv) favoriser le bien-être et préserver la santé des animaux, v) maximiser les services rendus par l’élevage. Elles génèrent notamment des données sur les phénotypes relatifs à l’efficience des ruminants, leurs capacités adaptatives et robustesse, et la qualité des produits. Ces phénotypes sont caractérisés par l’analyse du génome de l’animal hôte et de son expression, et par des analyses métagénomiques et métatranscriptomiques du microbiote symbiotique. Les données sont acquises en collaboration avec différentes plateformes françaises (PFEM à Theix, plateforme de protéomique de l’Institut H. Curien à Strasbourg, Génopole Ouest à Nantes, MetaQuant à Jouy-enJosas), et internationales (BGI en Chine, Roy J. Carver Biotechnology Center aux Etats-Unis, CSIRO en Australie et AgResearch en Nouvelle-Zélande). Une exploitation optimale des données produites dans l’unité ou par la communauté scientifique, nécessite des applications logicielles à développer et faire évoluer. L'ingénieur(e) sera intégré(e) au pôle informatique de l'unité, où deux autres agents ont une formation initiale en bioinformatique. Il/elle travaillera en assurant une interaction étroite avec les scientifiques des équipes de recherche qui conduisent des projets de biologie intégrative pour caractériser les phénotypes d’intérêt (Biomarqueurs et Dinamic) et les plateformes. La personne recrutée interagira avec l'Ingénieur gestionnaire des bases de données de l'unité, et avec les membres du groupe Informatique scientifique du Centre Auvergne-Rhône-Alpes (lieu de partage d'expériences de développeurs, bioinformaticiens et statisticiens). Au niveau régional, l'ingénieur(e) interagira avec des bioinformaticiens des laboratoires de l'IFR Santé-Auvergne et du réseau Auvergne Bioinformatique. Sur le plan national, l'ingénieur(e) sera un(e) correspondant(e) privilégié(e) entre le Centre et le réseau national SIGENAE. Il (elle) interagira avec des bioinformaticiens du CATI BBRIC (Centre Automatisé de Traitement de l'Information BioInformatique, Biodiversité, Représentation et Intégration des Connaissances) ou MIAGO (Mathématique et Informatique pour l'Analyse des Génomes aux Organismes). Au niveau international, il (elle) sera impliqué(e) dans les recherches réalisées en collaboration avec des bioinformaticiens du CSIRO et de l'Institut Suisse de Bioinformatique. Ce profil ouvre droit à une prime informatique de niveau analyste si le (la) candidat(e) est déjà qualifié(e) à ce niveau. Sinon, il/elle devra passer l’examen de qualification pour bénéficier de ladite prime. Compétences Il s’agit ici des compétences qui seront appelées à être développées tout ou partie, dans la mesure où le candidat ne les a pas déjà. Compétences cœur de métier : o o o o o o Connaissance approfondie des méthodes et outils de fouille de données (data mining) et de statistiques liées aux jeux de données massifs, Maîtrise d'au moins deux des langages de script (Perl, Python,...) et du langage Linus Shell, Maîtrise des langages et outils de développement web (Javascript, Boostrap, PHP...), Maîtrise de système de gestion de bases de données SQL (mySQL, ...), Maîtrise de l'environnement Linux, ainsi que la connaissance des stratégies de parallélisation Connaissance générale de bibliothèques de programmes de calcul scientifique Autres compétences : o o o o o o o Connaitre les architectures des ordinateurs et systèmes distribués et des systèmes d'exploitation Connaitre l’environnement Galaxy Travailler en interaction avec une ou plusieurs équipes de recherche Maîtriser l’ensemble des méthodologies de la conduite de projet Assurer l'organisation des données et le suivi de leur exploitation jusqu'à leur visualisation Transmettre un certain nombre de savoir-faire techniques et méthodologiques en adaptant ses explications au public concerné Maitriser l’anglais : Expression écrite et orale : niveau 2 ; Compréhension écrite et orale : niveau 2 Profils Il s’agit ici des profils indicatifs pour lesquels l’adaptation du candidat pour ce métier visé semble la plus aisée, mais dans le cadre de ce dispositif « métiers d’avenir » toutes les candidatures seront étudiées avec attention. Soit un(e) bioinformaticien(ne) de formation avec un intérêt pour la biologie. Soit un(e) biologiste avec une expérience dans les domaines de la fouille de données « omics » et de l'analyse des données de séquençage à compléter par une formation en bioinformatique et biostatistique. Savoir être : Qualités relationnelles et capacité à travailler en équipe : interaction à la fois avec les biologistes de l'unité d'accueil et les autres informaticiens et bioinformaticiens de l'Unité, du Département et de l’institut. Sens de l'organisation, rigueur et autonomie. Capacités à conduire plusieurs projets simultanément. Capacités à communiquer et rédiger. Pour aller plus loin Exemples de formations envisageables : Master "Bio-Informatique et Génomique" de l'Université de Rennes 1 https://etudes.univ-rennes1.fr/master-biogeno/ Catalogues de formation INRA http://migale.jouy.inra.fr/?q=fr/formations et CNRS https://cnrsformation.cnrs.fr/listestages-65-Statistiques%2C-bioinformatique%2C-big-data.html Réseau métier Inra (PEPI) sur Ingénierie Bioinformatique et Statistique pour les données haut-débit (IBIS) http://www6.inra.fr/pepi/Ingenierie-Bio-Informatique-et-Statistique-pour-les-donnees-haut-debit-IBIS Des informations relatives à la bioinformatique/informatique pour ce poste sont disponibles auprès de Matthieu Reichstadt ([email protected]) Modalités pour candidater Transmettre une lettre de motivation, un CV et/ou votre dernière fiche carrière à : Muriel Bonnet et Milka Popova Par e-mail : [email protected] et [email protected] Date limite pour postuler : 2 mai 2017 Dates envisagées pour l’entretien avec le comité de recrutement : 9 mai -19 mai 2017