Les variations de taille génomique

publicité
Evolution Moléculaire et Phylogénie
Dominique Mouchiroud
[email protected]
Biométrie et Biologie Evolutive, UMR5558, Lyon I
Bioinformatique et Génomique Evolutive
Plan du cours
I. L’évolution moléculaire
Cadre théorique
II. Evolution de quelques traits moléculaires
Taille des génomes
Composition en base des génomes
Taux d’évolution
III. Conclusion
Traits moléculaires
La génomique évolutive
mécanismes moléculaires + processus populationnels + environnement
Réplication (u)
Réparation
Recombinaison
Activité télomérase
Remaniement chromosomique
Taille de la population
Mode d’appariement
Comportement
Ecologie de l’organisme
……..
Latitude
Température
Rayonnement UV
……..
Plan du cours
II. Evolution de quelques traits moléculaires
Taille des génomes
Variation et paradoxe de la valeur C
Modèles d’évolution :
- Hypothèse neutre
- Hypothèse adaptative
- Hypothèse non adaptative
- Conclusion : toujours un mystère ?
ANIMAL GENOME SIZE DATABASE
http://www.genomesize.com/
Dr. T Ryan Gregory
université de Guelph, ontario, canada
"Il est hors de doute que l’étude systématique, de la teneur absolue du noyau
en acide désoxyribonucléique, à travers de nombreuses espèces animales,
puisse fournir des suggestions intéressantes en ce qui concerne le problème de
l’évolution."
- Vendrely and Vendrely, 1950
Welcome to the Animal Genome Size Database, Release 2.0,
a comprehensive catalogue of animal genome size data.
Haploid DNA contents (C-values, in picograms) are currently available
for 5635 species (3731 vertebrates and 1904 non-vertebrates) based on 7286 records
from 683 published sources. You can navigate the database using the menu on the left.
New features in Release 2.0 include enhanced browsing and search functions,
data export capabilities, up to the minute summaries of available data,
and a new genome size discussion forum.
Taille des génomes et paradoxe de la valeur C
Archées 0,491 – 5,751 Mb
Eubactéries 0,16 – 13,034 Mb
Eucaryotes 2,249 – 978 000 Mb
Taille des génomes et paradoxe de la valeur C
http://www.genomesize.com
1pg = 978 Mb
Comparaison de différents génomes de Vertébrés
Dérive génétique
ou pression de sélection ?
Protopterus aethiopicus
139 000 Mb
Xenopus laevis
Fugu rubripes
3 100 Mb
400 Mb
Cercopithecus cephus
5 200 Mb
Homo sapiens
2 900 Mb
Amphiuma means
84 000 Mb
Comparaison de différents génomes de Vertébrés
Temps en millions d’années
600
400
200
Tailles
moyennes
(pg)
Ecart types
(pg)
3
3,8
1,61
Chondrichthyens
10
14,6
10,66
Actinoptérygiens
108
2,6
1,26
3
222,0
62,04
Anoures
28
9
4,79
Urodèles
Mammifères
non-chiroptères
Chiroptères
40
75,8
34,18
95
7
1,14
26
5
0,83
Testudines
14
6,1
1,46
Oiseaux
102
2,9
0,31
2
5,8
1,13
67
4,4
1,3
Nombre de genres
utilisés
0
Agnathes
Dipneustes
Tétrapodes
Crocodiliens
Lépidosauriens
La taill e du géno me est généralement exprimée en picogramme (10-12g) par génome haploïde
(la valeur C, noté C) ou diploïde (2 fois la valeur C, noté 2C) en sachant que 1 pg correspond
à 0,98x10 9 pb d’ADN doub le brin.
?
Comparaison de différents génomes procaryotes
Sorangium cellulosum
Gram négatif
Myxobactérie du sol
13 034Kb – 10 000 gènes
Schneiker et al Nature biotech. 2007
Candidatus Carsonella ruddii
Gamma bactérie
Endosymbiote des psyllides
159Kb – 182 protéines
Nakabachi A science 2006
?
Nanoarchaeum equitans
Archée symbiote parasite
D’une autre archée Ignicoccus
490Kb – 536 gènes
Sabyasachi BMC Genomics 2006
Wernegreen , Nature Review in Genetics 2002
Methanosarcina acetivorans
Archée producteur de méthane
5 751 Kb – 4524 protéines
Comparaison de différents génomes eucaryotes
Muntiacus muntjak vaginalis
Muntiacus reevesi
6
46
Chinois
Indien
INDIEN
CHINOIS
Variation de la taille des génomes
• La taille des génomes varie entre espèces,
• Sans relation avec le niveau de complexité de l’organisme (nbre de tissus)
“paradoxe C”
• (ex. Homo sapiens 3 Gb : Amoeba dubia 670 Gb)
• sans relation avec le nombre de chromosomes
• (ex Muntiacus muntjak vaginalis 6 chr. : Muntiacus reevesi 46 chr)
• sans relation avec le nombre de gènes “paradoxe G”
• (ex Drosophile 13 700 gènes, Nématode 20500 gènes, Paramécie 40 000 gènes)
• Solution
La taille des génomes est déterminée par le packaging des gènes” (introns, séquences
répétées, junk DNA, etc).
Proportion d’ADN non codant
•
•
ADN informatif
– gènes protéiques
– code pour ARNt – ARNr-ARNn
– Régions régulatrices
ADN non informatif
– séquences répétées
• (ET, CNV, microsatellite)
Procaryotes
Eucaryotes
ADN informatif et non informatif
Gregory, Nature Reviews Genetics, 2005
Le turnover génomique
Amplification
• La duplication génomique ou polyploïdisation,
• La duplication chromosomique,
• La duplication génique par recombinaison inégale (ectopique),
• La transposition et la retrotransposition (pour ETs),
• Les transferts horizontaux (chez les procaryotes),
• La création de nouveaux gènes.
Contraction


La délétion génique par recombinaison inégale (ectopique)
Les microdélétions par dérapage de la polymérase
Le turnover génomique
Une très forte activité des transposons a conduit à un doublement
du génome du maïs 1,2 billions à 2,4 billions (conséquence de la
domestication).
Chez la drosophile, le taux de délétion de l’ADN est 60 plus
élevé que chez les mammifères alors que le criquet (Laupala)
qui a un taux de délétion 40 fois plus lent, a un génome 11 fois
plus important.
Mol Biol Evol. 2001.
Genomic gigantism: DNA loss is slow in
mountain grasshoppers.
Bensasson D, Petrov DA, Zhang DX, Hartl DL,
Hewitt GM.
Mécanismes moléculaires
Processus populationnel
Turnover
génomique
Mutations
germinales
Phénotype
Ne
Fixation
Plan du cours
II. Evolution de quelques traits moléculaires
Taille des génomes
Variation et paradoxe de la valeur C
Modèles d’évolution :
- Hypothèse neutre
- Hypothèse adaptative
- Hypothèse non adaptative
- Conclusion : toujours un mystère ?
Hypothèse neutraliste de la variation
de taille du génome
Théorie de l’ADN égoïste (selfish DNA theory)
(Doolittle and Sapeinza (1980) – Orgel and Crick (1980)
La majeur partie de l’ADN est constituée d’éléments capables de proliférer sans affecter
la fitness de l’organisme (ADN égoïste).
La théorie de l’ADN égoïste n’explique pas les contractions et amplifications propres
à certains génomes.
Hypothèse adaptative de la variation
de taille du génome
Théorie nucléotypique : sélection indirecte sur l’ADN
(Vinogradov AE 97,98,04, 06, Gregory TR 01,03,08,09, 13)
La quantité d’ADN non informatif est le produit indirect de la
sélection naturelle,
La taille du génome est liée au volume nucléaire, à la taille de la
cellule et à la vitesse de division cellulaire, composants qui
influencent des traits d’histoire de vie comme la vitesse de
développement ou l’activité métabolique,
Cette théorie adaptative de l’évolution de la taille des génomes
repose sur des approches corrélatives entre la taille du génome et
des traits phénotypiques sous sélection (nature des pressions,
cause ou conséquence ?).
Relation taille du noyau et taille des érythrocytes
(1875)
Erythrocytes
Dipneuste d’Australie « Neoceratodus forsteri »
2C=105 pg
Poisson « Betta splendens »
2C=1,3 pg
Salamandre « Amphiuma means »
2C = 168 pg
Homme « Homo sapiens »
2C = 7,0 pg
Taille du génome et volume cellulaire
au sein des Chordés
N=159 espèces
Agnathes
Chondrychthyens
Urodèles
Anoures
Téléostéens
oiseaux
Reptiles
Gregory, 2001
Gregory, 2001
Modèle d’évolution de la taille des génomes
Physiologie
Trait moléculaire
Turnover génomique
Relation entre traits d’histoire de vie et taille des génomes
Au sein des mammifères, il existe une relation inverse entre la masse corporelle et le taux métabolique
basale et ceci quelque soit le niveau taxonomique (ordre, genre, espèce) (Vinogradov 95, 2004).
En corrigeant le taux métabolique par la masse corporelle, il existe une relation inverse entre la taille du
génome et le taux métabolique basal. Une relation similaire a été observée chez les oiseaux.
Un effet similaire est observé avec la masse cardiaque (Vinogradov, 2006). Cette relation s’étend également
aux poïkilothermes.
Vinogradov, 2006
Oiseau
Mammifère
Amphibien
Reptile
Vinogradov, 95
Chez les oiseaux, la taille des génomes a été mise en relation avec
- l’aptitude au vol (Gregory, 2002)
- l’envergure des ailes chez les passereaux (Chandler, Proc, 2009)
Colibri
Des travaux utilisent la taille des cellules comme proxy de la
taille des génomes permettant d’inférer ce trait moléculaire
chez des organismes disparus.
Ptérosaure
70 MA avant les
oiseaux
Bleu : amphibien
Marron : mammifère
Vert : reptile (non aviaire)
Rouge : oiseau
Biology Letters, Organ et al 2008
Biology Letters, Organ et al 2008
Fossil cell size
Vert : archosaure- ptérosaure
Rouge : oiseau
Marron : chauve-souris
- Inférence de la
taille du génome
des archosaures.
- Réduction de la taille des
génomes prédate
l’acquisition du vol.
Chez les vertébrés homéothermes, il existe un lien corrélatif entre la taille
des génomes, la taille des cellules (érythrocyte, ostéocyte) et l’activité
métabolique des organismes.
Chez les oiseaux, la faible taille des génomes est mise en relation avec la
forte demande énergétique liée au vol.
Chez les amphibiens, la très grande taille des génomes chez les urodèles
est associée à des cellules de grande taille, un cycle cellulaire plus long,
une vitesse de croissance et de différenciation plus réduite conduisant à
un développement de type néoténique (Gregory, BJLS, 2003, Laurin et al, 2015).
Modèle adaptatif de la variation de taille des génomes
•
La forte variabilité de la taille des génomes due en grande partie à l’amplification des séquences
répétées (ETs) conduit à des effets pléïotropes sur des traits soumis à sélection chez l’hôte .
•
Les corrélations observées
•
•
Au niveau subcellulaire
• Taille du noyau, de la cellule
• Durée du cycle cellulaire
Au niveau organismique
• Masse corporelle
• Activité métabolique basale (vertébrés homéothermes)
• Vitesse de développement
• Durée de génération
• Durée de la mitose et de la meiose
• Taille des grains de pollen
• Durée de développement embryonnaire (amphibien)
• Complexité morphologique du cerveau (amphibien)
• Longévité ?
suggèrent fortement que la sélection naturelle joue un rôle important dans l’évolution
de la taille des génomes bien que la nature exact des pressions sélections restent à déterminer
ADN
Noyau
Taille du génome
Volume nucléaire
Rapport Surf cell. / Vol. cell.
Cellule
Métabolisme énergétique
Croissance cellulaire
Organisme
Vitesse de
Développement
Division cellulaire
Métabolisme basal
Longévité
Milieu
Pressions de sélection
ADN
Noyau
Taille du génome
Volume nucléaire
Rapport Surf cell. / Vol. cell.
Cellule
Métabolisme énergétique
Croissance cellulaire
Division cellulaire
Stratégie
Wasteful/Frugal
Organisme
Vitesse de
Développement
Métabolisme basal
Longévité
Milieu
Pressions de sélection
• Les mécanismes moléculaires impliqués dans les variations de taille
génomique sont :
• Biais dans les processus insertion/délétion de l’ADN (cf drosophile,
criquet)
• Biais dans l’efficacité de réparation de l’ADN
• Fréquence des évènements de duplication (géniques ou génomiques)
(cf plante, poisson)
GBE, 2012
• Les variations de taille génomique notamment l’expansion des
rétroéléments voir des duplications sont également conditionnées par :
• Pression environnementale (ressources, ….)
• Système de reproduction (autogame, allogame)
• Taille efficace de la population (masse corporelle)
Hypothèse non adaptative de la variation
de taille du génome
Théorie non adaptative : impact de la taille efficace Ne
(Lynch 03,06, 10, 11, 12 ,Whitney 10)
Michael Lynch (1960)
Professeur à l’université du Minnesota
Rôle essentiel de la dérive génétique et des
mutations délétères (processus non adaptatif)
dans la mise en place de la complexité des
génomes des organismes vivants.
The Evolution of Genome Complexity. Despite the common view that a causal link exists between
complexity at the genomic and organismal levels, little thought has gone into the mechanisms that
are responsible for the origin of the fundamental features of the eukaryotic genome.
Using population-genetic principles as a guide to understanding the evolution of duplicate genes,
introns, mobile-genetic elements, and regulatory-region complexity, our work is advancing the
hypothesis that much of eukaryotic genomic complexity initially evolved as a
passive indirect response to reduced population size (relative to the situation in prokaryotes).
Expansion du nombre de gènes avec l’évolution de la multicellularité
Cause ou Effet ?
Vertebrata
30,000 – 50,000
Urochordata
16,000
Arthropoda
14,000
Nematoda
21,000
Fungi
2,000 – 13,000
Vascular plants
25,000 – 60,000
Unicellular sps.
5,000 – 10,000
Prokaryotes
500 - 7,000
Modèle d’évolution neutre
 A l’équilibre, le nombre moyen de mutations fixées (substitutions) aux
sites neutres est égal au nombre moyen de mutations qui ségrègent dans la
population,
 Le taux de polymorphisme ou diversité génétique attendu sous le modèle
neutre est égal à
4Neµ / prop à Neµ
avec µ : taux de mutation
Ne : nombres d’allèles par génome haploïde
sous l’hypothèse d’une population infinie d’allèle
 La diversité génétique (taux de polymorphisme) mesurée pour chaque
organisme est donc un bon estimateur de Neµ
m = 5 10-11 – 5 10-10
Ne > 108
107 > Ne > 108
105 > Ne > 106
104 > Ne > 105
Lynch M, science 2003
Modèle de Lynch : mutational hazard hypothesis
L’augmentation globale de la taille des génomes et conjointement
du nombre de gènes des procaryotes jusqu’aux eucaryotes
multicellulaires est liée à une réduction très importante de la taille
efficace des populations qui ont conduit à une augmentation de la
dérive génétique.
La dérive génétique a eu comme conséquence la prolifération de
composants génomiques (séquences répétées, éléments dupliquées,
etc) non éliminés par la sélection naturelle.
Génomes de grande taille impliquent des chromosomes de grande taille
d’où des taux de recombinaison plus faibles par chromosome et donc un
fardeau génétique plus important.
Hypothèse non adaptative
La structuration complexe des génomes apparaît comme une
réponse pathologique à une faible taille efficace et à la présence de
mutations délétaires :
•
•
•
•
Augmentation du nombre de gène – rétention des gènes dupliqués.
Régions régulatrices modulaires plus complexes.
Prolifération des introns (nucléaire)
Transposons et retrotransposons.
L’évolution adaptative est une conséquence secondaire
d’une telle complexité.
Plan du cours
II. Evolution de quelques traits moléculaires
Taille des génomes
Variation et paradoxe de la valeur C
Modèles d’évolution :
- Hypothèse neutre
- Hypothèse adaptative
- Hypothèse non adaptative
- Conclusion : toujours un mystère ?
Ne : paramètre clé pour la dynamique des génomes
 Ne estimée à partir de données de polymorphisme : PS prop Ne u
Ne récent – nécessité d’un marqueur neutre
 Ne estimée à partir de données de divergence : dN/dS prop à Ne s
si Ne élevée, sélection, purge des mutations délétères : dN/dS faible
si Ne faible, dérive génétique, fixation de mutations délétères
: dN/dS élevé
Ne plus ancien – dépend de la fonction du gène – nécessité dS
marqueur neutre (pas vrai si biais d’usage du code)
 Ne estimée à partir de la masse corporelle : relation inverse avec M
Ne récent
Problèmes avec l’estimation de Neu (Lynch, 2003)
- utilisation de la diversité actuelle aux sites silencieux (Daubin and
Moran 2004 )
impact de la structure de la population
impact du cycle de vie – système de reproduction
- taux de mutation (u) diffère selon les taxons
- taille efficace Ne est un facteur confondant (masse corporelle,
reproduction, etc)
- échantillonnage taxonomique réduit (peu d’espèces de grande taille)
- pas prise en compte de l’inertie phylogénétique (Whitney – Garland,
Plos Genetic 2010, 2011)
Relation taille/GC des génomes procaryotes
Génome de grande taille, organisme
dans environnement variable :
Exemple des bactéries libres
Caractéristique : Ne élevée
E. Coli Ne entre 108-1010 – 4000 gènes
Buchnera aphicola Ne = 107 – 618 gènes
Données (Wernegreen 2015)
Génome de petite taille, organisme dans environnement stable :
Exemple des bactéries endosymbiotiques
Caractéristique : Ne faible
Reductive genome evolution at both ends of the bacterial population size spectrum
Bérénice Batut, Carole Knibbe, Gabriel Marais and Vincent Daubin
Endosymbiote / bactérie libre E. Coli
Buchnera aphidicola 86% réduction
recombinaison
26% GC contre 50% GC
Cyanobactérie marine : écotype en fonction nutriment
Prochlorococcus spp 38% réduction
30,8% GC contre 50 % GC
Ne=107 perte des gènes de la
Ne=1011 pas perte des gènes de la recombinaison
Modèle d’évolution de Lynch
Modèle de Lynch : Taille des génomes augmente avec l’effet de la
dérive génétique (diminution de Ne)
Attendus :
- relation < 0 entre la taille des génomes et la diversité génétique
(Ps) (diminution de Ne, diminution de la diversité, augmentation de
la taille des génomes)
- relation > 0 entre la taille des génomes et la divergence (dN/dS)
(diminution de Ne, augmentation de la divergence, augmentation
de la taille des génomes)
Observations (Batut et al 2014) :
- Pas de relation significative entre
le taux de diversité et la taille des
génomes (courbe rouge)
- Génome de Prochlorococcus se
caractérise par un taux de
polymorphisme très élevé (lié à une
taille efficace importante) pour une
taille de génome très faible.
- Relation >0 avec l’inverse de la
divergence (dS/dN) donc inverse à ce
qui est attendu avec le modèle de
Lynch (courbe bleu).
Conclusions(1)
 Ne présente des effets opposés sur la taille des génomes eucaryotes et
procaryotes liés aux effets de la dérive génétique.
- augmentation de la taille des génomes eucaryotes avec la diminution de la taille efficace (modèle
de Lynch),
- diminution de la taille des génomes procaryotes (bactéries endosymbiotiques) avec la diminution
de la taille efficace.
Hypothèse : patron de mutation différent - biais insertion/délétion
- procaryote : biais vers délétion de petites tailles
- eucaryote : pas de biais
 Existence de bactéries libres qui montrent les effets de réduction de taille
identique à celles des bactéries endosymbiotiques (Batut 2014).
- Cas de Prochlorococcus marinus (écotype avec Ne élevé 109-1011).
Hypothèse : contrainte environnementale - adaptation (sélection) à un
environnement pauvre en nutriment – réduction de taille de cellule .
Conclusion (2)
• Les deux modèles évolutifs « Adaptatif et non
adaptatif» agissent simultanément sur la taille des
génomes mais à des échelles de temps différentes
(niveau taxonomique).
• Les forces évolutives qui jouent sur la taille des
génomes dépendent de la biologie, de la physiologie et
de l’écologie des organismes.
La génomique évolutive
mécanismes moléculaires + processus populationnels + environnement
Réplication (u)
Réparation
Recombinaison
Activité télomérase
Remaniement chromosomique
Taille de la population
Mode d’appariement
Comportement
Ecologie de l’organisme
……..
Latitude
Température
Rayonnement UV
……..
Téléchargement