Analyse des données de séquençage massif par des méthodes phylogénétiques Roux S., Taib N., Mangot J.F., Hugoni M., Mary I., Ravet V., Bronner G., Enault F., Debroas D. Équipe Microbiologie de l'Environnement et Bioinformatique Laboratoire Micro-organismes : Génome et Environnement UMR CNRS 6023 – Université Blaise Pascal Caractérisation des microbiomes Majorité des espèces ( > 99% bactéries ) non cultivées. Grande richesse : 4.1030 bactéries sur terre, formant plus de 109 espèces Méthodes d'analyse des séquences Recherche de similarité (BLAST, Uclust, …) Classification bayésienne (RDP Classifier, Mothur, ...) Approches phylogénétiques (STAP, RAIphy, ...) Approches phylogénétiques Caractérisation taxonomique de l'assemblage microbien Détection de nouveaux clades Analyse de liens évolutifs Approches phylogénétiques Caractérisation taxonomique de l'assemblage microbien Détection de nouveaux clades Analyse de liens évolutifs Newton et al., 2007 Séquençage d'amplicons Marqueur phylogénétique : petite sous unité de l’ARN ribosomique (18S/16S). • Universalité • Régions conservées / variables Séquençage aléatoire : métagénomique Séquençage massif aléatoire du pool d'ADN prélevé. • Approche "naïve" • Informations sur différents gènes / fonctions Outils bioinformatiques PANAM : A Tool for the Phylogenetic Analysis and Taxonomic Affiliation of SSU rRNA Amplicons. N. Taïb et al. (BMC Bioinformatics ; en révision) http://code.google.com/p/panam-phylogenetic-annotation METAVIR : a web server dedicated to virome analysis. S. Roux et al. (Bioinformatics ; 2011 Nov 1 ; 27(21) : 3074-5) http://metavir-meb.univ-bpclermont.fr/ PANAM : Étapes Prétraitement Détection des chimères Pangea (Giongo et al ; 2010) Sample 1 Qualité et taille Tri Sample 2 Sample 3 Sample 4 Clusterisation Uclust (Edgar, 2010) Indices de diversité Sample 1 Sample 2 Sample 3 Sample 4 Annotation phylogénétique PANAM : Étapes d'affiliation Annotation phylogénétique Sample 1 Base de Référence PANAM USEARCH (Edgar, 2010) Sample 2 Sample 3 Sample 4 Séquences requêtes + Taxonomie de la séquence voisine Alignements de référence Séquences requêtes triées selon groupes phylétiques PANAM : Étapes d'affiliation Annotation phylogénétique Base de Référence PANAM Alignement avec le profil correspondant (HMMER, Eddy, 1998) Alignements de référence Reconstruction Phylogénétique (FastTree, Price et al., 2010) Annotation taxonomique Clades environnementaux Séquences requêtes triées selon groupes phylétiques PANAM : Restitution taxonomique Restitution taxonomique : capacité du logiciel d'affiliation à déterminer la taxonomie correcte d'une séquence connue. 100% 90% PANAM BLAST STAP RDP 80% 70% 60% 50% Kingdom Phylum • • Class Order Family Genus Simulations sur séquences complètes (eucaryotes) Restitution : > 90 % au niveau genre • Détection de clades environnementaux (Lepère et al., 2008) PANAM : Restitution taxonomique ➔ Simulations sur run de pyroséquençage (400 pb) Bactéries 16S Eucaryotes 18S 100% 100% 90% 90% 80% 80% PANAM STAP RDP 70% 70% 60% 60% 50% 50% Kingdom Phylum • PANAM STAP RDP Class Order Family Genus Kingdom phylum Class Restitution : > 75 % au niveau genre pour le 18S > 90 % au niveau genre pour le 16S order Family Genus PANAM : performances 200 180 160 Hours 140 120 100 80 60 100 200 400 800 40 20 0 5000 50000 100000 250000 500000 750000 Sequences Simulations sur un CPU 2 GHz Xeon et 24 GB RAM 1000000 bp bp bp bp PANAM : performances Dynamique à court terme des petits eucaryotes lacustres 200 180 160 Hours 140 24 prélèvements 348 567 séquences brutes 248 597 séquences nettoyées 1017 OTUs 120 100 80 60 100 200 400 800 40 20 0 5000 50000 100000 250000 500000 750000 bp bp bp bp 1000000 Sequences Simulations sur un CPU 2 GHz Xeon et 24 GB RAM Temps de traitement total : 30 minutes Variations à court terme de la diversité du picoplancton eucaryote lacustre : approche par séquençage massif I. Domaizon Poster 12 PANAM : Perspectives Web service intégré, dédié à l'étude de la diversité des microorganismes. Calcul distribué (cluster local / grille de calcul). PANAM : Perspectives Web service intégré, dédié à l'étude de la diversité des microorganismes. Calcul distribué (cluster local / grille de calcul). Epanam. N. Taib Poster 45 Suivi de communautés microbiennes • Suivi de communautés bactériennes en réponse à un stress Impact du tébuconazole sur les communautés bactériennes : Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon Projet SENDEFO Évaluation de l’impact du tébuconazole (fongicide) sur les communautés bactériennes de lacs et de rivières par une approche de pyroséquençage de l’ARNr 16S. N. Pascault Poster 38 Suivi de communautés microbiennes • Suivi de communautés bactériennes en réponse à un stress Impact du tébuconazole sur les communautés bactériennes : Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon Projet SENDEFO • Suivi de communautés spécifiques et comparaison d'échantillons Étude des Archaea en milieu marin ADN & ARN : Diversité / Activité des Archaea 80 échantillons Observation de clades spécifiques Évolution au cours du temps (série temporelle sur 3 ans 1/2) Projet DIVAQUA Diversité spécifique et fonctionnelle des communautés archéennes oxydant l’ammonium dans les écosystèmes aquatiques. M. Hugoni Poster 20 Suivi de communautés microbiennes • Suivi de communautés bactériennes en réponse à un stress Impact du tébuconazole sur les communautés bactériennes : Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon Projet SENDEFO • Suivi de communautés spécifiques et comparaison d'échantillons Étude des Archaea en milieu marin ADN & ARN : Diversité / Activité des Archaea 80 échantillons Observation de clades spécifiques Évolution au cours du temps (série temporelle sur 3 ans 1/2) Projet DIVAQUA • Suivi globale des communautés microbiennes lacustres Diversité lacustre eucaryote et procaryote : Lac Pavin / Bourget Observatoire de l'environnement Suivi sur une année, en parallèle : 16S Bactéries / 16S Archées / 18S SOERE GLACPE Outils bioinformatiques PANAM : A Tool for the Phylogenetic Analysis and Taxonomic Affiliation of SSU rRNA Amplicons. Najwa Taïb et al. http://code.google.com/p/panam-phylogenetic-annotation METAVIR : a web server dedicated to virome analysis. Simon Roux et al. Bioinformatics (Nov 2011) http://metavir-meb.univ-bpclermont.fr/ METAVIR Base de données de 80 viromes publiés METAVIR : Arbres phylogénétiques à partir de différents marqueurs METAVIR : Arbres phylogénétiques à partir de différents marqueurs contig_1 read_9 Cap3 (Huang, 1999) contig_2 METAVIR : Arbres phylogénétiques à partir de différents marqueurs contig_1 read_9 Cap3 (Huang, 1999) contig_2 Hmmer (Eddy,1998) >Chlamydia_phage_1 VVQST-DSVQGNLSAYALST--DTKHLFTKSFV-EHGFVIGLLSAT >Chlamydia_phage_2 IPQST-DSTQGNLAAYGTAI--GSKRVFTKSFT-EHGVILGLASVR >Bdellovibrio_phage VPQSS-TTDQGNLAAFSTASEFGNKIGFSKSFV-EHGYVLGFIRAR >Spiroplasma_virus VPQSTVEKMQGNLAAFSETM-IQNNYLVNKTFT-EHSYIIVLAVVR >contig_1 >contig_2 QST--SVQGNLSAYATST-FDT DGST----QGSLGQFSGRVAATYKH TKSFT-EHGVILGLASV >read_9 METAVIR : Arbres phylogénétiques à partir de différents marqueurs contig_1 read_9 Cap3 (Huang, 1999) contig_2 Hmmer (Eddy,1998) >Chlamydia_phage_1 VVQST-DSVQGNLSAYALST--DTKHLFTKSFV-EHGFVIGLLSAT >Chlamydia_phage_2 IPQST-DSTQGNLAAYGTAI--GSKRVFTKSFT-EHGVILGLASVR >Bdellovibrio_phage VPQSS-TTDQGNLAAFSTASEFGNKIGFSKSFV-EHGYVLGFIRAR >Spiroplasma_virus VPQSTVEKMQGNLAAFSETM-IQNNYLVNKTFT-EHSYIIVLAVVR >contig_1 Gblocks (Talavera & Castresana,2007) PhyML (Guindon & Gascuel, 2003) >contig_2 QST--SVQGNLSAYATST-FDT DGST----QGSLGQFSGRVAATYKH TKSFT-EHGVILGLASV >read_9 Chlamydia_phage_1 Chlamydia_phage_2 contig_1 Bdellovibrio_phage Spiroplasma_virus contig_2 Entero_phage_ID22 Entero_phage_NC28 Chlamydia_phage_1 Chlamydia_phage_2 read_9 Bdellovibrio_phage Spiroplasma_virus Entero_phage_ID22 Entero_phage_NC28 METAVIR : composition taxonomique GAAS (Angly et al., 2009) Krona (Ondov et al., 2011) Lac du Bourget : Composition taxonomique de la fraction virale METAVIR : Diversité des Microviridae Lac Bourget / Lac Pavin / Lac Limnopolar Caractérisation des communautés virales • Diversité des communautés virales lacustres Viromes des lacs Pavin et Bourget projet Metavir Caractérisation des communautés virales • Diversité des communautés virales lacustres Viromes des lacs Pavin et Bourget projet Metavir • Diversité des virus d'Archaea 6 viromes le long d'un gradient de salinité projet Archevir Caractérisation des communautés virales • Diversité des communautés virales lacustres Viromes des lacs Pavin et Bourget projet Metavir • Diversité des virus d'Archaea 6 viromes le long d'un gradient de salinité projet Archevir • Comparaison des communautés virales de milieux extrêmes Virome(s) de la zone anoxique du lac Pavin projet DICENTIM Gisèle Bronner Jean-Christophe Charvy Didier Debroas Emilie Duffaud François Enault Mylène Hugoni Isabelle Jouan Jean-François Mangot Corinne Petit-Biderre Isabelle Mary Bushra Parveen Vivane Ravet Simon Roux Najwa Taïb Agnès Vellet Vincent Breton Tung Doan Gisèle Bronner Jean-Christophe Charvy Didier Debroas Emilie Duffaud François Enault Mylène Hugoni Isabelle Jouan Jean-François Mangot Corinne Petit-Biderre Isabelle Mary Bushra Parveen Vivane Ravet Simon Roux Najwa Taïb Agnès Vellet Hélène Agogué Agnès Bouchez Isabelle Domaizon Noémie Pascault Engelbert Mephu Nguifo Pierre Galand Ian Saulter Joan Artigas Stéphane Pesce Jean-François Humbert Julie Leloup Jonathan Colombet Agnès Robin Télèsphore Sime-Ngando Yvan Bettarel