Simon ROUX

publicité
Analyse des données de séquençage massif
par des méthodes phylogénétiques
Roux S., Taib N., Mangot J.F., Hugoni M., Mary I., Ravet V., Bronner G., Enault F., Debroas D.
Équipe Microbiologie de l'Environnement et Bioinformatique
Laboratoire Micro-organismes : Génome et Environnement
UMR CNRS 6023 – Université Blaise Pascal
Caractérisation des microbiomes

Majorité des espèces ( > 99% bactéries ) non cultivées.

Grande richesse : 4.1030 bactéries sur terre, formant plus de 109 espèces
Méthodes d'analyse des séquences

Recherche de similarité (BLAST, Uclust, …)

Classification bayésienne (RDP Classifier, Mothur, ...)

Approches phylogénétiques (STAP, RAIphy, ...)
Approches phylogénétiques

Caractérisation taxonomique de l'assemblage microbien

Détection de nouveaux clades

Analyse de liens évolutifs
Approches phylogénétiques

Caractérisation taxonomique de l'assemblage microbien

Détection de nouveaux clades

Analyse de liens évolutifs
Newton et al.,
2007
Séquençage d'amplicons
Marqueur phylogénétique : petite sous unité de l’ARN ribosomique (18S/16S).
• Universalité
• Régions conservées / variables
Séquençage aléatoire : métagénomique
Séquençage massif aléatoire du pool d'ADN prélevé.
• Approche "naïve"
• Informations sur différents gènes / fonctions
Outils bioinformatiques
PANAM : A Tool for the Phylogenetic Analysis and Taxonomic
Affiliation of SSU rRNA Amplicons.
N. Taïb et al. (BMC Bioinformatics ; en révision)
http://code.google.com/p/panam-phylogenetic-annotation
METAVIR : a web server dedicated to virome analysis.
S. Roux et al. (Bioinformatics ; 2011 Nov 1 ; 27(21) : 3074-5)
http://metavir-meb.univ-bpclermont.fr/
PANAM : Étapes
Prétraitement
Détection des chimères
Pangea (Giongo et al ; 2010)
Sample 1
Qualité
et taille
Tri
Sample 2
Sample 3
Sample 4
Clusterisation
Uclust (Edgar, 2010)
Indices de
diversité
Sample 1
Sample 2
Sample 3
Sample 4
Annotation phylogénétique
PANAM : Étapes d'affiliation
Annotation phylogénétique
Sample 1
Base de
Référence
PANAM
USEARCH
(Edgar, 2010)
Sample 2
Sample 3
Sample 4
Séquences requêtes +
Taxonomie de la séquence voisine
Alignements
de référence
Séquences requêtes
triées selon
groupes phylétiques
PANAM : Étapes d'affiliation
Annotation phylogénétique
Base de
Référence
PANAM
Alignement avec
le profil correspondant
(HMMER, Eddy, 1998)
Alignements
de référence
Reconstruction
Phylogénétique
(FastTree, Price et al., 2010)
Annotation taxonomique
Clades environnementaux
Séquences requêtes
triées selon
groupes phylétiques
PANAM : Restitution taxonomique
Restitution taxonomique : capacité du logiciel d'affiliation à déterminer la
taxonomie correcte d'une séquence connue.
100%
90%
PANAM
BLAST
STAP
RDP
80%
70%
60%
50%
Kingdom Phylum
•
•
Class
Order
Family
Genus
Simulations sur séquences complètes
(eucaryotes)
Restitution : > 90 % au niveau genre
• Détection de clades environnementaux
(Lepère et al., 2008)
PANAM : Restitution taxonomique
➔
Simulations sur run de pyroséquençage (400 pb)
Bactéries 16S
Eucaryotes 18S
100%
100%
90%
90%
80%
80%
PANAM
STAP
RDP
70%
70%
60%
60%
50%
50%
Kingdom Phylum
•
PANAM
STAP
RDP
Class
Order
Family
Genus
Kingdom phylum Class
Restitution : > 75 % au niveau genre pour le 18S
> 90 % au niveau genre pour le 16S
order
Family Genus
PANAM : performances
200
180
160
Hours
140
120
100
80
60
100
200
400
800
40
20
0
5000
50000
100000
250000
500000
750000
Sequences
Simulations sur un CPU 2 GHz
Xeon et 24 GB RAM
1000000
bp
bp
bp
bp
PANAM : performances
Dynamique à court terme des
petits eucaryotes lacustres
200
180
160
Hours
140

24 prélèvements

348 567 séquences brutes

248 597 séquences nettoyées

1017 OTUs
120
100
80
60
100
200
400
800
40
20
0
5000
50000
100000
250000
500000
750000
bp
bp
bp
bp
1000000
Sequences
Simulations sur un CPU 2 GHz
Xeon et 24 GB RAM
Temps de traitement total : 30 minutes
Variations à court terme de la
diversité du picoplancton
eucaryote lacustre : approche par
séquençage massif
I. Domaizon
Poster 12
PANAM : Perspectives
Web service intégré, dédié à l'étude de la diversité des microorganismes.
Calcul distribué (cluster local / grille de calcul).
PANAM : Perspectives
Web service intégré, dédié à l'étude de la diversité des microorganismes.
Calcul distribué (cluster local / grille de calcul).
Epanam.
N. Taib
Poster 45
Suivi de communautés microbiennes
• Suivi de communautés bactériennes en réponse à un stress
Impact du tébuconazole sur les communautés bactériennes :
Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon
Projet SENDEFO
Évaluation de l’impact du tébuconazole (fongicide)
sur les communautés bactériennes de lacs et de
rivières par une approche de pyroséquençage de
l’ARNr 16S.
N. Pascault
Poster 38
Suivi de communautés microbiennes
• Suivi de communautés bactériennes en réponse à un stress
Impact du tébuconazole sur les communautés bactériennes :
Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon
Projet SENDEFO
• Suivi de communautés spécifiques et comparaison d'échantillons
Étude des Archaea en milieu marin
ADN & ARN : Diversité / Activité des Archaea
80 échantillons
Observation de clades spécifiques
Évolution au cours du temps (série temporelle sur 3 ans 1/2)
Projet DIVAQUA
Diversité spécifique et fonctionnelle des
communautés archéennes oxydant
l’ammonium dans les écosystèmes
aquatiques.
M. Hugoni
Poster 20
Suivi de communautés microbiennes
• Suivi de communautés bactériennes en réponse à un stress
Impact du tébuconazole sur les communautés bactériennes :
Suivi sur 21 jours en triplicat. ~ 3000 séquences par échantillon
Projet SENDEFO
• Suivi de communautés spécifiques et comparaison d'échantillons
Étude des Archaea en milieu marin
ADN & ARN : Diversité / Activité des Archaea
80 échantillons
Observation de clades spécifiques
Évolution au cours du temps (série temporelle sur 3 ans 1/2)
Projet DIVAQUA
• Suivi globale des communautés microbiennes lacustres
Diversité lacustre eucaryote et procaryote : Lac Pavin / Bourget
Observatoire de l'environnement
Suivi sur une année, en parallèle : 16S Bactéries / 16S Archées / 18S
SOERE GLACPE
Outils bioinformatiques
PANAM : A Tool for the Phylogenetic Analysis and Taxonomic
Affiliation of SSU rRNA Amplicons.
Najwa Taïb et al.
http://code.google.com/p/panam-phylogenetic-annotation
METAVIR : a web server dedicated to virome analysis.
Simon Roux et al. Bioinformatics (Nov 2011)
http://metavir-meb.univ-bpclermont.fr/
METAVIR
Base de données de 80 viromes publiés
METAVIR : Arbres phylogénétiques à
partir de différents marqueurs
METAVIR : Arbres phylogénétiques à
partir de différents marqueurs
contig_1
read_9
Cap3
(Huang, 1999)
contig_2
METAVIR : Arbres phylogénétiques à
partir de différents marqueurs
contig_1
read_9
Cap3
(Huang, 1999)
contig_2
Hmmer
(Eddy,1998)
>Chlamydia_phage_1
VVQST-DSVQGNLSAYALST--DTKHLFTKSFV-EHGFVIGLLSAT
>Chlamydia_phage_2
IPQST-DSTQGNLAAYGTAI--GSKRVFTKSFT-EHGVILGLASVR
>Bdellovibrio_phage
VPQSS-TTDQGNLAAFSTASEFGNKIGFSKSFV-EHGYVLGFIRAR
>Spiroplasma_virus
VPQSTVEKMQGNLAAFSETM-IQNNYLVNKTFT-EHSYIIVLAVVR
>contig_1
>contig_2
QST--SVQGNLSAYATST-FDT
DGST----QGSLGQFSGRVAATYKH
TKSFT-EHGVILGLASV
>read_9
METAVIR : Arbres phylogénétiques à
partir de différents marqueurs
contig_1
read_9
Cap3
(Huang, 1999)
contig_2
Hmmer
(Eddy,1998)
>Chlamydia_phage_1
VVQST-DSVQGNLSAYALST--DTKHLFTKSFV-EHGFVIGLLSAT
>Chlamydia_phage_2
IPQST-DSTQGNLAAYGTAI--GSKRVFTKSFT-EHGVILGLASVR
>Bdellovibrio_phage
VPQSS-TTDQGNLAAFSTASEFGNKIGFSKSFV-EHGYVLGFIRAR
>Spiroplasma_virus
VPQSTVEKMQGNLAAFSETM-IQNNYLVNKTFT-EHSYIIVLAVVR
>contig_1
Gblocks (Talavera &
Castresana,2007)
PhyML (Guindon &
Gascuel, 2003)
>contig_2
QST--SVQGNLSAYATST-FDT
DGST----QGSLGQFSGRVAATYKH
TKSFT-EHGVILGLASV
>read_9
Chlamydia_phage_1
Chlamydia_phage_2
contig_1
Bdellovibrio_phage
Spiroplasma_virus
contig_2
Entero_phage_ID22
Entero_phage_NC28
Chlamydia_phage_1
Chlamydia_phage_2
read_9
Bdellovibrio_phage
Spiroplasma_virus
Entero_phage_ID22
Entero_phage_NC28
METAVIR : composition taxonomique
GAAS (Angly et al., 2009)
Krona (Ondov et al., 2011)
Lac du Bourget : Composition taxonomique de la fraction virale
METAVIR : Diversité des Microviridae
Lac Bourget / Lac Pavin / Lac Limnopolar
Caractérisation des communautés virales
• Diversité des communautés virales lacustres
Viromes des lacs Pavin et Bourget
projet Metavir
Caractérisation des communautés virales
• Diversité des communautés virales lacustres
Viromes des lacs Pavin et Bourget
projet Metavir
• Diversité des virus d'Archaea
6 viromes le long d'un gradient de salinité
projet Archevir
Caractérisation des communautés virales
• Diversité des communautés virales lacustres
Viromes des lacs Pavin et Bourget
projet Metavir
• Diversité des virus d'Archaea
6 viromes le long d'un gradient de salinité
projet Archevir
• Comparaison des communautés virales
de milieux extrêmes
Virome(s) de la zone anoxique du lac Pavin
projet DICENTIM
Gisèle Bronner
Jean-Christophe Charvy
Didier Debroas
Emilie Duffaud
François Enault
Mylène Hugoni
Isabelle Jouan
Jean-François Mangot
Corinne Petit-Biderre
Isabelle Mary
Bushra Parveen
Vivane Ravet
Simon Roux
Najwa Taïb
Agnès Vellet
Vincent Breton
Tung Doan
Gisèle Bronner
Jean-Christophe Charvy
Didier Debroas
Emilie Duffaud
François Enault
Mylène Hugoni
Isabelle Jouan
Jean-François Mangot
Corinne Petit-Biderre
Isabelle Mary
Bushra Parveen
Vivane Ravet
Simon Roux
Najwa Taïb
Agnès Vellet
Hélène Agogué
Agnès Bouchez
Isabelle Domaizon
Noémie Pascault
Engelbert Mephu Nguifo
Pierre Galand
Ian Saulter
Joan Artigas
Stéphane Pesce
Jean-François Humbert
Julie Leloup
Jonathan Colombet
Agnès Robin
Télèsphore Sime-Ngando
Yvan Bettarel
Téléchargement