d ’ I l e - d e - F r a n c e H e a l t h O n e J o u r n é e s BIG DATA une évolution, une révolution, une promesse pour le diagnostic 27 novembre 2014 de 13h30 à 17h30 Amphithéâtre 3 du Campus Centre UPEC Le séminaire sera suivi d’un cocktail 13H30 Café d’accueil 13H45 Introduction générale par Jorge Boskowski, UPEC 1ère partie : Retour sur les promesses du haut débit : de l’identification des nouveaux agents viraux au pronostic Chairman: Benoît Funalot, IMRB 14H00 Identification et découverte de pathogènes par séquençage haut débit Marc ELOIT Institut Pasteur, Laboratoire de Découverte de Pathogènes, Département de Virologie PathoQuest Les techniques de séquençage à haut débit (Next Generation Sequencing, NGS) ont permis à la fois le développement de nouveaux concepts et de nouveaux outils dans de nombreuses disciplines, dont la microbiologie. Sous ce terme, on englobe des approches différentes, qui ont pour conséquence d’élargir considérablement la liste des pathogènes identifiables. Si le typage bactérien peut être réalisé au moins jusqu’au niveau du genre par le séquençage du gène 16S ou d’autres régions du génome suffisamment conservées pour permettre la définition d’amorces consensus, mais suffisamment variables pour permettre un typage, aucun gène similaire n’est disponible pour l’identification virale. L’objectif d’élargissement du spectre de détection pour les virus passe actuellement par le développement de stratégies de PCR multiplexées. Cette technologie de PCR couplée à une identification des amplicons par NGS est également commercialement disponible. Il reste néanmoins à identifier si de telles PCR multiplexées peuvent être appliquées à une large gamme de virus, certains d’entre eux étant très variables en séquence, sans perdre la sensibilité analytique qui est un des avantages majeurs de la PCR. De plus le dessin de nombreuses amorces (des centaines ou milliers) aptes à fonctionner ensemble est difficile, et devrait être constamment réactualisé, avec l’augmentation du nombre de séquences disponibles dans les bases de données et avec l’identification de nouveaux virus Une stratégie alternative, que nous développons tire avantage de la disponibilité de plus en plus grande, de la vitesse croissante et de la baisse accélérée du coût du NGS. Il est devenu fréquent d’utiliser désormais les outils de la métagénomique, qui est l’étude de l’ensemble des génomes présents dans un environnement biologique. Cette technique est plutôt qualifiée de Whole-Genome NGS (W-G NGS). Dans cette approche sans a priori du microbiome, la séquence de tous les acides nucléiques présents dans un échantillon est comparée aux bases de données, et permet d’identifier des agents infectieux connus, mais également nouveaux sur la base d’homologies lointaines, voire des critères d’organisation génétique. L’utilisation de cette technologie explose dans différents domaines de la virologie : découverte de pathogènes en particulier dans des émergences[1], identification et caractérisation de de pathogènes connus [2] y compris comme responsables de syndromes où ils n’avaient pas été identifiés préalablement [3], étude du virome ou plus globalement du microbiome dans un objectif d’association avec la santé ou la maladie, ou le degré d’immunosuppression [4,5][6], de surveillance de vecteurs [7] ou de réservoirs animaux [8]. L’assemblage de novo de génome viral de taille complète peut être obtenu directement à partir d’échantillons biologiques. Nous présenterons nos travaux dans ce domaine, dans un objectif de découverte de nouveaux pathogènes et de diagnostic à large spectre. 14H30 Les Cancers de la vessie de type basal : découverte bioinformatique et validation fonctionnelle Yves Allori Equipe de recherche translationnelle en oncogénèse génito-urinaire (IMRB, INSERM U955, Créteil) Dans le cadre du programme Carte d’Identité des Tumeurs de la Ligue Contre le Cancer et d’une collaboration entre l’Equipe de recherche translationnelle en oncogénèse génito-urinaire (IMRB, INSERM U955, Créteil) et le groupe d’oncologie moléculaire (UMR144, Institut Curie, Paris), nous cherchons à établir une taxonomie moléculaire des cancers de la vessie pour identifier de nouvelles cibles thérapeutiques. Une approche transcriptomique nous a permis d’identifier dans notre jeu de données un sous-groupe de tumeur de type basal. L’analyse des jeux de données publiques en a ensuite confirmé l’existence et a mis en évidence un pronostic péjoratif. L’analyse bioinformatique des voies moléculaires exprimées a suggéré une place importance de la voie dépendant de l’EGFR. Pour valider fonctionnellement cette hypothèse, nous avons utilisé la signature basale pour identifier des modèles du type basal in vitro et chez la souris, et les traitements ciblant l’EGFR sont apparus très significativement plus efficaces dans ces modèles comparés aux modèles de type non basal. L’identification de ce sous-groupe permettra d’envisager des essais cliniques ciblés, et d’essayer d’en améliorer le pronostic. Parallèlement, nous en poursuivons la caractérisation en recherchant des signatures diagnostiques utilisables en routine clinique et en continuant l’intégration des données génomiques et épigénomiques. 15H00 Métagénomique du microbiote digestif pour le pronostic Dusko Ehrlich Metagenopolis, INRA Jouy-en-Josas Le microbiome intestinal humain est une communauté complexe, composée de centaines d’espèces chez chaque individu. Une nouvelle méthodologie, Métagénomique quantitative, basée sur le séquençage d’ADN à haut débit et sur la capacité de traiter des téraoctets de données dans les temps raisonnables, a permis de la caractériser avec une précision inégalée. Le microbiome est à la fois semblable chez tous et spécifique de chacun. Ses altérations permettent de diagnostiquer les maladies chroniques et même déterminer leur sévérité; de suivre la réponse à un traitement et même de la prévoir. De plus, son analyse permet d’identifier les individus qui courent un risque plus élevé de développer des maladies chroniques graves, tel que le diabète ou les complications cardiovasculaires. Les altérations peuvent avoir des effets nocifs et contribuer à la maladie. Au delà du diagnostique et du pronostique, les traitements pour corriger les altérations du microbiome commencent a être développés, ce qui ouvre des nouvelles perspectives de lutte contre les maladies chroniques, par prévention plutôt que par la cure. 15H30 Pause café 2ème partie : Les recherches aux frontières : de l’analyse des variants à la modélisation fonctionnelle Chairmen : Benoît Malpaux, INRA et Renaud Tissier, ENVA 16H00 Médecine prédictive personnalisée pour le traitement des infections virales, utilisation des techniques de séquençage à haut débit sur la plateforme pACT et outils de modélisation de la dynamique des populations virale Christophe Rodriguez INSERM U955 Eq18, UPEC, Dpt de Virologie, Bactériologie-Hygiène, Mycologie-Parasitologie du CHU Henri Mondor à CRETEIL Les virus hautement variables tels que le VIH ou les virus d’hépatites sont présents chez les patients sous forme de quasi-espèces, c’est-à-dire qu’ils existent naturellement sous forme d’une multitude de souspopulations qui coexistent et possèdent chacune des aptitudes génétiques distinctes. Next Parmi elles certaines comGeneration Sequencing portent des capacités de pACT résistance aux traitements antiviraux ou d’échappement au système immunitaire. Ces capacités sont liées à des mutations qui sont en général associées à un défaut de réplication dit aussi de « fitness » ; ainsi, les variants qui les supportent sont présents chez les patients à un niveau très faible PyroMIC en l’absence de pression de sélection (traitement antiviral par exemple), indécelable par les techniques classiques de dépistage mais émergent rapidement lorsque le traitement est introduit. Cependant, lorsque l’on possède des techniques ayant une sensibilité suffisante, il est possible d’évaluer les facteurs de risque d’échec thérapeutique chez un patient infecté avant ou au tout début de sont traitement. Notre laboratoire s’est ainsi spécialisé dans les approches expérimentales de séquençage à haut débit pour le screening des sous-populations virales mais aussi analytiques et biostatistiques par la création d’outils mathématiques de modélisation de cinétique des populations et d’outils de détection des populations virales à risque parmi les nombreux variants circulants chez un patient. Aujourd’hui, la plateforme pACT de séquençage à haut débit, disponible sur le site du CHU Henri Mondor, réalise une grande partie des études de cohorte de patients infectés par le VIH ou les hépatites virales supportées par l’ANRS et offre une multitude d’outils bioinfo/biostatistiques applicables à de nombreuses questions en infectiologie pour l’amélioration de la prise en charge des patients infectés. Variability percentage RNase H gene X gene 50%-60% 40%-50% 30%-40% 70% 60% 50% 40% 30% Patients 100% 80% C52R ChIP-Seq Motif Detection (GADEM) V55A H57K K165E V163I H57K 0% J0 J0+8h J1 V55A J2 J3 V163I K165E RNA-Seq T54A J256 J284 C52R J420 (FUS12) Proteomics 2D-Dige Ontology © Interactomics 832 828 824 820 816 812 808 804 800 796 792 788 784 780 776 772 768 764 760 756 752 748 744 740 736 732 728 724 720 716 712 708 704 700 696 692 688 684 680 HBV RNase H positions (in aa) 20% 60%-70% 80% 0% T54A 70%-80% 90% 10% 40% 80%-90% 100% 20% 60% 90%-100% 20%-30% 10%-20% 0%-10% 16H20 L’analyse générique des interactions protéiques hôte-pathogène Damien Vitour ANSES-EnvA-INRA L’établissement d’une infection par un microorganisme pathogène repose requiert une multitude d’interactions moléculaires avec la machinerie de la cellule hôte pour en détourner les fonctions nécessaires à sa réplication et sa dissémination et/ou contrer les défenses antimicrobiennes élaborées par cette dernière. De nombreuses approches méthodologiques sont disponibles aujourd’hui pour identifier et étudier ces interactions, parmi lesquelles le double-hybride en levures qui reste une méthode privilégiée pour explorer ces questions. La réalisation de cribles de banques d’ADNc à partir d’une séquence cible «appât» permet en effet l’identification sans a priori de nouveaux interactants protéiques. A l’heure de la globalisation de la « omique » dans tous les domaines du vivant, l’interactomique s’impose plus que jamais comme un thème majeur dans la compréhension du dialogue hôte-pathogène. 16H40 Des données très haut débit à la modélisationdu développement embryonnaire (ou des tissus) Isabelle HUE INRA Le blastocyste de ruminants a cela de particulier qu’il passe, avant l’implantation dans l’utérus, par une phase d’élongation qui modifie à la fois sa taille et sa forme. Il passe en effet en moins de quinze jours de 150µm à 30cm en acquérant séquentiellement les formes ovoïdes, tubulaires et filamenteuses alors que s’initie, dans la partie embryonnaire, le processus qui détermine les axes de développement du futur fœtus. Cependant, les bases cellulaires et moléculaires de ces phénomènes, et de leur coordination, ne sont pas élucidées. Des données physiologiques ont montré que l’élongation requiert les sécrétions des glandes utérines, dépend de leur densité et ne peut avoir lieu in vitro, tandis que des données moléculaires haut-débit ont généré des dynamiques d’expressions géniques qui ouvrent la voie à l’étude des régulations de cette croissance exponentielle et polarisée qui, par sa cinétique, prend les apparences d’un processus tumoral. Dans ce contexte, nous attendons de modèles dynamiques la capacité de simuler des processus morphogénétiques, sources d’hypothèses et de validations biologiques, pour tenter de relier formes et mécanismes. 17H00 Discussion générale 17H20 Synthèse par Muriel Mambrini-Doudet, INRA 17H30 Cocktail d ’ I l e - d e - F r a n c e H e a l t h O n e J o u r n é e s BIG DATA : une évolution, une révolution, une promesse pour le diagnostic Nous vivons une période exceptionnelle de production scientifique qui résulte pour beaucoup d’une production à haut débit de données et de capacités accrues de développements informatique. Concernant les sciences du vivant, nous nous sentons bientôt capables de modéliser et prédire les mécanismes physiologiques à partir des données génériques accumulées. Dans le domaine de la santé, médecins, vétérinaires et agronomes se surprennent à rêver d’outils diagnostics et pronostics précis et personnalisés. Voici que les avancées techniques nous intiment d’avoir l’ambition d’embrasser les systèmes du vivant . Le Big data révolutionne autant les moyens de financer la recherche sur le vivant que la manière de l’organiser et de la concevoir. Science et technique convergent, il s’agit pour la recherche de savoir créer un univers technoscientifique intégré, accessible et partagé. Partagé également avec la société, car, en offrant la possibilité de résoudre les questions complexes qu’elle se pose et qu’elle nous pose, cet univers technoscientifique par essence virtuel et modélisateur, aura une puissance qu’il conviendra d’encadrer. Ce qui limite nos avancées est moins les techniques que nos capacités, tant financières que conceptuelles, d’y accéder et de les intégrer. Les forces franciliennes en biologie, et en biologie animale en particulier, en mathématiques, physique, chimie, informatique et sciences de l’Ingénieur sont remarquables. Le défi est de pouvoir associer les dimensions cognitives, méthodologiques et d’ingénierie, sans omettre la question de l’impact, l’Ile de France est creuset pour ce faire. Pour autant, chacun doit pouvoir tracer des itinéraires favorables, et donc une stratégie, où les intérêts des différents territoires scientifiques convergent, en ayant comme moteur commun l’enjeu sociétal et les défis scientifiques à relever comme force de «penser ensemble». Alors le Big data, une évolution, une révolution ou une promesse ? Cette journée « One Health » propose deux temps : - un temps de conférences de pionniers, qui se sont lancés dans le haut « débit » pour qu’elles révèlent leurs promesses et « parlent » de ce que nous n’avions pas encore ou étions incapables d’identifier. - un temps de partage de sujets « aux frontières des disciplines » pour nous faire percevoir les évolutions et révolutions. Nous augurons que ce partage au sein de communautés scientifiques appelées à mettre leurs connaissances du vivant au service de la santé et des performances, sera pour chacun une source de créativité et éclairera nos itinéraires individuels comme collectifs pour porter cette nouvelle biologie au service des diagnostics et pronostics pour l’agronomie et la médecine de demain voire d’après demain.