BIG DATA BIG DATA

publicité
d ’ I l e - d e - F r a n c e
H e a l t h
O n e
J o u r n é e s
BIG DATA
une évolution, une révolution, une
promesse pour le diagnostic
27 novembre 2014 de 13h30 à 17h30
Amphithéâtre 3 du Campus Centre UPEC
Le séminaire sera suivi d’un cocktail
13H30
Café d’accueil
13H45
Introduction générale par Jorge Boskowski, UPEC
1ère partie :
Retour sur les promesses du haut débit :
de l’identification des nouveaux agents viraux au pronostic
Chairman: Benoît Funalot, IMRB
14H00
Identification et découverte de pathogènes par séquençage haut débit
Marc ELOIT
Institut Pasteur, Laboratoire de Découverte de Pathogènes, Département de Virologie
PathoQuest
Les techniques de séquençage à haut débit (Next Generation Sequencing, NGS) ont permis à la fois le développement de nouveaux concepts et de nouveaux outils dans de nombreuses disciplines, dont la microbiologie. Sous ce
terme, on englobe des approches différentes, qui ont pour conséquence d’élargir considérablement la liste des
pathogènes identifiables. Si le typage bactérien peut être réalisé au moins jusqu’au niveau du genre par le séquençage du gène 16S ou d’autres régions du génome suffisamment conservées pour permettre la définition d’amorces
consensus, mais suffisamment variables pour permettre un typage, aucun gène similaire n’est disponible pour
l’identification virale. L’objectif d’élargissement du spectre de détection pour les virus passe actuellement par
le développement de stratégies de PCR multiplexées. Cette technologie de PCR couplée à une identification des
amplicons par NGS est également commercialement disponible. Il reste néanmoins à identifier si de telles PCR
multiplexées peuvent être appliquées à une large gamme de virus, certains d’entre eux étant très variables en
séquence, sans perdre la sensibilité analytique qui est un des avantages majeurs de la PCR. De plus le dessin
de nombreuses amorces (des centaines ou milliers) aptes à fonctionner ensemble est difficile, et devrait être
constamment réactualisé, avec l’augmentation du nombre de séquences disponibles dans les bases de données et
avec l’identification de nouveaux virus
Une stratégie alternative, que nous développons tire avantage de la disponibilité de plus en plus grande, de la
vitesse croissante et de la baisse accélérée du coût du NGS. Il est devenu fréquent d’utiliser désormais les outils de
la métagénomique, qui est l’étude de l’ensemble des génomes présents dans un environnement biologique. Cette
technique est plutôt qualifiée de Whole-Genome NGS (W-G NGS). Dans cette approche sans a priori du microbiome,
la séquence de tous les acides nucléiques présents dans un échantillon est comparée aux bases de données, et
permet d’identifier des agents infectieux connus, mais également nouveaux sur la base d’homologies lointaines,
voire des critères d’organisation génétique. L’utilisation de cette technologie explose dans différents domaines de
la virologie : découverte de pathogènes en particulier dans des émergences[1], identification et caractérisation de
de pathogènes connus [2] y compris comme responsables de syndromes où ils n’avaient pas été identifiés préalablement [3], étude du virome ou plus globalement du microbiome dans un objectif d’association avec la santé ou
la maladie, ou le degré d’immunosuppression [4,5][6], de surveillance de vecteurs [7] ou de réservoirs animaux
[8]. L’assemblage de novo de génome viral de taille complète peut être obtenu directement à partir d’échantillons biologiques. Nous présenterons nos travaux dans ce domaine, dans un objectif de découverte de nouveaux
pathogènes et de diagnostic à large spectre.
14H30
Les Cancers de la vessie de type basal : découverte bioinformatique et
validation fonctionnelle
Yves Allori
Equipe de recherche translationnelle en oncogénèse génito-urinaire
(IMRB, INSERM U955, Créteil)
Dans le cadre du programme
Carte d’Identité des Tumeurs
de la Ligue Contre le Cancer et d’une collaboration
entre l’Equipe de recherche
translationnelle en oncogénèse génito-urinaire (IMRB,
INSERM U955, Créteil) et le
groupe d’oncologie moléculaire (UMR144, Institut Curie,
Paris), nous cherchons à établir une taxonomie moléculaire des cancers de la vessie
pour identifier de nouvelles
cibles thérapeutiques. Une
approche transcriptomique
nous a permis d’identifier dans notre jeu de données un sous-groupe de tumeur de type basal. L’analyse des jeux
de données publiques en a ensuite confirmé l’existence et a mis en évidence un pronostic péjoratif. L’analyse
bioinformatique des voies moléculaires exprimées a suggéré une place importance de la voie dépendant de l’EGFR.
Pour valider fonctionnellement cette hypothèse, nous avons utilisé la signature basale pour identifier des modèles
du type basal in vitro et chez la souris, et les traitements ciblant l’EGFR sont apparus très significativement plus
efficaces dans ces modèles comparés aux modèles de type non basal. L’identification de ce sous-groupe permettra
d’envisager des essais cliniques ciblés, et d’essayer d’en améliorer le pronostic. Parallèlement, nous en poursuivons la caractérisation en recherchant des signatures diagnostiques utilisables en routine clinique et en continuant
l’intégration des données génomiques et épigénomiques.
15H00
Métagénomique du microbiote digestif pour le pronostic
Dusko Ehrlich
Metagenopolis, INRA Jouy-en-Josas
Le microbiome intestinal humain est une communauté complexe, composée de centaines d’espèces chez chaque
individu. Une nouvelle méthodologie, Métagénomique quantitative, basée sur le séquençage d’ADN à haut débit et
sur la capacité de traiter des téraoctets de données dans les temps raisonnables, a permis de la caractériser avec
une précision inégalée. Le microbiome est à la fois semblable chez tous et spécifique de chacun. Ses altérations
permettent de diagnostiquer les maladies chroniques et même déterminer leur sévérité; de suivre la réponse à un
traitement et même de la prévoir. De plus, son analyse permet d’identifier les individus qui courent un risque plus
élevé de développer des maladies chroniques graves, tel que le diabète ou les complications cardiovasculaires. Les
altérations peuvent avoir des effets nocifs et contribuer à la maladie. Au delà du diagnostique et du pronostique,
les traitements pour corriger les altérations du microbiome commencent a être développés, ce qui ouvre des nouvelles perspectives de lutte contre les maladies chroniques, par prévention plutôt que par la cure.
15H30
Pause café
2ème partie :
Les recherches aux frontières :
de l’analyse des variants à la modélisation fonctionnelle
Chairmen : Benoît Malpaux, INRA et Renaud Tissier, ENVA
16H00
Médecine prédictive personnalisée pour le traitement des infections
virales, utilisation des techniques de séquençage à haut débit sur la
plateforme pACT et outils de modélisation de la dynamique des populations virale
Christophe Rodriguez
INSERM U955 Eq18, UPEC, Dpt de Virologie, Bactériologie-Hygiène, Mycologie-Parasitologie du CHU Henri Mondor à CRETEIL
Les virus hautement variables
tels que le VIH ou les virus
d’hépatites sont présents chez
les patients sous forme de quasi-espèces, c’est-à-dire qu’ils
existent naturellement sous
forme d’une multitude de souspopulations qui coexistent et
possèdent chacune des aptitudes génétiques distinctes.
Next
Parmi elles certaines comGeneration
Sequencing
portent des capacités de
pACT
résistance aux traitements
antiviraux ou d’échappement
au système immunitaire. Ces
capacités sont liées à des
mutations qui sont en général
associées à un défaut de réplication dit aussi de « fitness » ;
ainsi, les variants qui les supportent sont présents chez les
patients à un niveau très faible
PyroMIC
en l’absence de pression de
sélection (traitement antiviral
par exemple), indécelable par les techniques classiques de dépistage mais émergent rapidement lorsque le
traitement est introduit. Cependant, lorsque l’on possède des techniques ayant une sensibilité suffisante, il est
possible d’évaluer les facteurs de risque d’échec thérapeutique chez un patient infecté avant ou au tout début
de sont traitement. Notre laboratoire s’est ainsi spécialisé dans les approches expérimentales de séquençage à
haut débit pour le screening des sous-populations virales mais aussi analytiques et biostatistiques par la création
d’outils mathématiques de modélisation de cinétique des populations et d’outils de détection des populations
virales à risque parmi les nombreux variants circulants chez un patient. Aujourd’hui, la plateforme pACT de
séquençage à haut débit, disponible sur le site du CHU Henri Mondor, réalise une grande partie des études de
cohorte de patients infectés par le VIH ou les hépatites virales supportées par l’ANRS et offre une multitude
d’outils bioinfo/biostatistiques applicables à de nombreuses questions en infectiologie pour l’amélioration
de la prise en charge des patients infectés.
Variability percentage
RNase H gene
X gene
50%-60%
40%-50%
30%-40%
70%
60%
50%
40%
30%
Patients
100%
80%
C52R
ChIP-Seq
Motif Detection (GADEM)
V55A
H57K
K165E
V163I
H57K
0%
J0
J0+8h
J1
V55A
J2
J3
V163I
K165E
RNA-Seq
T54A
J256
J284
C52R
J420
(FUS12)
Proteomics
2D-Dige
Ontology
©
Interactomics
832
828
824
820
816
812
808
804
800
796
792
788
784
780
776
772
768
764
760
756
752
748
744
740
736
732
728
724
720
716
712
708
704
700
696
692
688
684
680
HBV RNase H positions (in aa)
20%
60%-70%
80%
0%
T54A
70%-80%
90%
10%
40%
80%-90%
100%
20%
60%
90%-100%
20%-30%
10%-20%
0%-10%
16H20
L’analyse générique des interactions protéiques hôte-pathogène
Damien Vitour
ANSES-EnvA-INRA
L’établissement d’une infection par un microorganisme pathogène repose requiert une multitude d’interactions
moléculaires avec la machinerie de la cellule hôte pour en détourner les fonctions nécessaires à sa réplication
et sa dissémination et/ou contrer les défenses antimicrobiennes élaborées par cette dernière. De nombreuses
approches méthodologiques sont disponibles aujourd’hui pour identifier et étudier ces interactions, parmi lesquelles le double-hybride en levures qui reste une méthode privilégiée pour explorer ces questions. La réalisation
de cribles de banques d’ADNc à partir d’une séquence cible «appât» permet en effet l’identification sans a priori
de nouveaux interactants protéiques. A l’heure de la globalisation de la « omique » dans tous les domaines du
vivant, l’interactomique s’impose plus que jamais comme un thème majeur dans la compréhension du dialogue
hôte-pathogène.
16H40
Des données très haut débit à la modélisationdu développement embryonnaire (ou des tissus)
Isabelle HUE
INRA
Le blastocyste de ruminants a cela de particulier qu’il
passe, avant l’implantation dans l’utérus, par une phase
d’élongation qui modifie à la fois sa taille et sa forme. Il
passe en effet en moins de quinze jours de 150µm à 30cm
en acquérant séquentiellement les formes ovoïdes, tubulaires et filamenteuses alors que s’initie, dans la partie embryonnaire, le processus qui détermine les axes de développement du futur fœtus. Cependant, les bases cellulaires et
moléculaires de ces phénomènes, et de leur coordination,
ne sont pas élucidées.
Des données physiologiques ont montré que l’élongation
requiert les sécrétions des glandes utérines, dépend de leur
densité et ne peut avoir lieu in vitro, tandis que des données moléculaires haut-débit ont généré des dynamiques
d’expressions géniques qui ouvrent la voie à l’étude des
régulations de cette croissance exponentielle et polarisée
qui, par sa cinétique, prend les apparences d’un processus
tumoral.
Dans ce contexte, nous attendons de modèles dynamiques la capacité de simuler des processus morphogénétiques, sources d’hypothèses et de validations biologiques, pour tenter de relier formes et mécanismes.
17H00
Discussion générale
17H20
Synthèse par Muriel Mambrini-Doudet, INRA
17H30
Cocktail
d ’ I l e - d e - F r a n c e
H e a l t h
O n e
J o u r n é e s
BIG DATA :
une évolution, une révolution,
une promesse pour le diagnostic
Nous vivons une période exceptionnelle de production scientifique qui résulte
pour beaucoup d’une production à haut débit de données et de capacités accrues
de développements informatique. Concernant les sciences du vivant, nous nous
sentons bientôt capables de modéliser et prédire les mécanismes physiologiques à
partir des données génériques accumulées.
Dans le domaine de la santé, médecins,
vétérinaires et agronomes se
surprennent à rêver d’outils
diagnostics et pronostics précis et personnalisés.
Voici que les avancées techniques nous intiment d’avoir l’ambition d’embrasser les systèmes
du vivant .
Le Big data révolutionne autant les moyens de financer la recherche sur le vivant
que la manière de l’organiser et de la concevoir. Science et technique convergent, il s’agit
pour la recherche de savoir créer un univers technoscientifique intégré, accessible et partagé.
Partagé également avec la société, car, en offrant la possibilité de résoudre les questions
complexes qu’elle se pose et qu’elle nous pose, cet univers technoscientifique par
essence virtuel et modélisateur, aura une puissance qu’il conviendra d’encadrer.
Ce
qui
limite
nos
avancées
est
moins
les
techniques
que
nos
capacités, tant financières que conceptuelles, d’y accéder et de les intégrer.
Les forces franciliennes en biologie, et en biologie animale en particulier, en
mathématiques, physique, chimie, informatique et sciences de l’Ingénieur sont
remarquables. Le défi est de pouvoir associer les dimensions cognitives, méthodologiques et
d’ingénierie, sans omettre la question de l’impact, l’Ile de France est creuset pour ce faire.
Pour autant, chacun doit pouvoir tracer des itinéraires favorables, et donc une stratégie,
où les intérêts des différents territoires scientifiques convergent, en ayant comme moteur
commun l’enjeu sociétal et les défis scientifiques à relever comme force de «penser
ensemble». Alors le Big data, une évolution, une révolution ou une promesse ?
Cette journée « One Health » propose deux temps :
- un temps de conférences de pionniers, qui se sont lancés dans le haut « débit » pour qu’elles révèlent leurs promesses et « parlent » de ce que nous n’avions pas encore ou étions incapables d’identifier.
- un temps de partage de sujets « aux frontières des disciplines » pour nous faire
percevoir les évolutions et révolutions.
Nous augurons que ce partage au sein de communautés scientifiques
appelées à mettre leurs connaissances du vivant au service de la santé et des
performances, sera pour chacun une source de créativité et éclairera nos itinéraires
individuels comme collectifs pour porter cette nouvelle biologie au service des
diagnostics et pronostics pour l’agronomie et la médecine de demain voire d’après demain.
Téléchargement