Evolution Moléculaire et Phylogénie Dominique Mouchiroud [email protected] Plan du cours I. L’évolution moléculaire I1. Le cadre théorique I2. Les données et les questionnements II. Evolution de quelques traits moléculaires II.1 Composition en Base des Génomes II.2 Taux d’évolution II.3. Taille des génomes Biométrie et Biologie Evolutive, UMR5558, Lyon I Bioinformatique et Génomique Evolutive III. Conclusion Traits moléculaires Etude des processus évolutifs en relation avec les composantes écologiques La taille des génomes http://www.genomesize.com Génome nucléaire et cytoplasmique Dr. T Ryan Gregory Taille des populations Génomique évolutive Taille des génomes Composition en base Répartition des ETs Taux d’évolution Packaging de ll’ADN ADN …… Traits Moléculaires Ecologie évolutive Dérive génétique Composante adaptative Durée de génération Activité métabolique Longévité Masse corporelle Mode de vie Système de reproduction Traits d’Histoire de Vie 1pg = 978 Mb 1 Variation de taille à l’échelle du vivant Michael Lynch (1960) Professeur à l’université du Minnesota Théorie des p processus évolutifs non adaptatifs p (Lynch M. , 2032, 2006, PNAS 2010, MBE 2012) Rôle essentiel de la dérive génétique (processus neutre) dans la mise en place de la complexité des génomes des organismes vivants. The Evolution of Genome Complexity. Despite the common view that a causal link exists between complexity at the genomic and organismal levels, little thought has gone into the mechanisms that are responsible for the origin of the fundamental features of the eukaryotic genome genome. Using population-genetic principles as a guide to understanding the evolution of duplicate genes, introns, mobile-genetic elements, and regulatory-region complexity, our work is advancing the hypothesis that much of eukaryotic genomic complexity initially evolved as a passive indirect response to reduced population size (relative to the situation in prokaryotes). Expansion du nombre de gènes avec l’évolution de la multicellularité Cause ou Effet ? Vertebrata 30,000 – 50,000 Urochordata 16,000 Arthropoda 14,000 Nematoda 21,000 Fungi 2,000 – 13,000 Vascular plants 25 000 – 60,000 25,000 60 000 Unicellular sps. 5,000 – 10,000 Hypothèse non adaptative 100% 10% 1% 100% 10% 1% 100% 10% 1% Prokaryotes 500 - 7,000 2 Modèle d’évolution neutre u= 5 10-11 – 5 10-10 Ne > 108 • A l’équilibre, le nombre moyen de mutations fixées (substitutions) aux sites neutres est égal au nombre moyen de mutations qui ségrègent dans la population, l i • Le taux de polymorphisme ou diversité génétique attendu sous le modèle neutre est égal à 107 > Ne > 108 4Neµ avec µ : taux de mutation Ne : nombres d’allèles par génome haploïde sous l’hypothèse l’h thè d’une d’ population l ti infinie i fi i d’allèle d’ llèl 105 > Ne > 106 • La diversité génétique (taux de polymorphisme) mesurée pour chaque organisme est donc un bon estimateur de Neµ 104 > Ne > 105 Lynch M, science 2003 Modèle de Lynch L’augmentation L’ t ti globale l b l d de lla ttaille ill des d génomes é et conjointement j i du nombre de gènes des procaryotes jusqu’aux eucaryotes multicellulaires est liée à une réduction très importante de la taille efficace des populations qui ont conduit à une augmentation de la dérive génétique. La dérive génétique a eu comme conséquence la prolifération de composants génomiques (séquences répétées, éléments dupliquées, etc) non éliminés par la sélection naturelle. Génome de grande taille implique des chromosomes de grande taille d’où des taux de recombinaison plus faibles par chromosome d’où un fardeau génétique plus important 3 Hypothèse non adaptative La structuration complexe des génomes apparaît comme une réponse pathologique à une faible taille efficace et à la présence de mutations délétaires : • • • • Augmentation du nombre de gène – rétention des gènes dupliqués. Régions régulatrices modulaires plus complexes. Prolifération des introns (nucléaire) Transposons et retrotransposons. L’évolution adaptative est une conséquence secondaire d’une telle complexité. Modèle d’évolution de la taille des génomes Au niveau populationnel : Relation entre taille efficace et masse corporelle 10-7 individus /M2 pour les vertébrés de grande taille 1011 individus /M2 pour les eucaryotes unicellulaires Au niveau génomique (Lynch M): Relation entre taille des génomes et taux de mutation impact sur le turnover génomique ou fardeau mutationnel Relation entre taille des génomes et taille efficace impact sur les effets de la sélection purificatrice Modèle de Lynch : modèle non adaptatif (effet dérive génétique (Ne) et taux de mutations délétères) Variation de taille à l’échelle du vivant Théorie des processus évolutifs non adaptatifs (Lynch M. , 2003, 2006, PNAS 2010, MBE 2012) Débat sur l’hypothèse de la taille efficace : 4 Problèmes avec l’estimation de Neµ : - utilisation de la diversité actuelle aux sites silencieux (Daubin and Moran 2004 ) structure de la population cycle de vie – système de reproduction - taux de mutation différents selon les taxons - taille efficace Ne est un facteur confondant (masse corporelle, reproduction, etc) - échantillonnage taxonomique réduit (peu d’espèces de grande taille) - pas prise en compte de l’inertie phylogénétique (Whitney – Garland, Plos Genetic 2010, 2011) 5 Variation de taille à l’échelle d’un groupe taxonomique - Evolution de la taille des génomes procaroytes -Evolution de la taille des génomes de mammifères et d’oiseaux Evolution de la taille des génomes procaryotes Candidatus Carsonella ruddii Gamma bactérie Endosymbiote des psyllides 16,6% GC 159Kb – 182 p protéines Nakabachi A science 2006 Relation taille/GC des génomes procaryotes Sorangium cellulosum Gram négatif Myxobactérie du sol 13 034Kb – 10 000 gènes S h ik ett all N Schneiker Nature t bi biotech. t h 2007 ? Nanoarchaeum equitans Archée symbiote parasite D’une autre archée Ignicoccus 490Kb – 536 gènes Sabyasachi BMC Genomics 2006 Methanosarcina acetivorans Archée p producteur de méthane 42,7% GC 5 751 Kb – 4524 protéines 6 Evolution de la composition en GC des bactéries endosymbiotiques Composition en GC : adaptation et/ou dérive génétique - Existence d’un biais mutationnel vers AT universel (Hershberg, 2010), - Bactéries endosymbiotiques évoluent sous dérive et expriment un fort biais mutationnel vers AT associé avec une forte réduction de taille de leur génome, - Bactéries libres avec des valeurs de Ne élevées peuvent fixer par sélection des variants à fortes valeurs adaptatives (GC par exemple), C l t Calyptogena Symbionte de palourdes (1) Relaxation des pressions de sélection (Ne ) Hirokazu et al, extremophiles 2008 (2) Taux de substitutions très élevés (délétions, substitutions (3) Réduction de la taille du génome (perte de gènes de réparation) - Augmentation en GC pour répondre à des contraintes environnementales (T°, oxygène, ….) - Bactéries libres avec des valeurs de Ne élevées peuvent fixer par biais de conversion génique des variants GC (en relation avec la recombinaison) (4) Biais mutationnel vers AT (sélection en faveur du GC) Hypothèse de travail : gBGC et taille des génomes • Les bactéries de g grande taille présentent p un nombre de ggènes important, • Mise en place de la recombinaison pour réduire le fardeau génétique lié à l’accumulation de mutations délétères sur un nbre de gènes importants, • La recombinaison s’accompagne d’un biais d’enrichissement en GC. Variation de taille à l’échelle d’un groupe taxonomique - Evolution de la taille des génomes procaryotes - Evolution de la taille des génomes de mammifères et d’oiseaux 7 Variation de la taille des génomes eucaryotes multicellulaires ADN informatif et non informatif • La taille des génomes varie entre espèces, – Sans relation avec le niveau de complexité de ll’organisme organisme (nbre de tissus) “paradoxe C” • (ex. Homo sapiens 3 Gb : Amoeba dubia 670Gb) – sans relation avec le nbre de chromosomes • (ex Muntiacus muntjak vaginalis 6 chr. : Muntiacus reevesi 46 chr) – sans relation avec le nbre de gènes “paradoxe G” • (ex Drosophile 13 700 gènes, Nématode 20500 gènes, Paramécie 40 000 gènes) • Solution La taille des génomes est déterminée par le packaging des gènes” (introns, séquences répétées, junk DNA, etc). Gregory, Nature Reviews Genetics, 2005 Le turnover génomique QUELQUES EXEMPLES Amplification • • • • • • La duplication génomique ou polyploïdisation, La duplication chromosomique, chromosomique La duplication génique par recombinaison inégale (ectopique), La transposition et la retrotransposition (pour ETs), Les transferts horizontaux (chez les procaryotes), La création de nouveaux gènes. Contraction La délétion génique par recombinaison inégale (ectopique) Les microdélétions par dérapage de la polymérase Une très forte activité des transposons p a conduit à un doublement du génome du maïs 1,2 billions à 2,4 billions au cours de 3 millions d’années. Chez la drosophile, le taux de délétion de l’ADN est 60 plus élevé que chez les mammifères alors que le criquet (Laupala) qui a un taux de délétion 40 fois plus lent, a un génome 11 fois plus important. Mol Biol Evol. 2001. Genomic gigantism: DNA loss is slow in mountain grasshoppers. Bensasson D, Petrov DA, Zhang DX, Hartl DL, Hewitt GM. 8 Mécanismes moléculaires Turnover génomique Mutations germinales Pression sélective ou dérive génétique Si Ne très petit, quelque soit la valeur de s, valeur sélective s < 1/2Ne la sélection ne peut opérer et la dérive génétique l’emporte Processus popu ulationnel Phénotype Si Ne grand et s ≠ 0 Ne |s | > 1/2Ne la sélection positive peut opérer Fixation Force évolutive s’exerçant sur la taille des génomes Hypothèse de l’ADN égoïste ADN poubelle (junk DNA Ohno 72) et/ou égoïste (Doolittle and Sapienza 80, Orgel et Crick 80) Une part importante du génome est constituée d’éléments égoïstes capable de proliférer jusqu’à ce que le coût pour l’hôte devienne trop important, i la l sélection él i naturelle ll agit i pour contrer cette expansion, La plus part de l’ADN non codant est constitué d’ADN égoïste. Mais…. Les contributeurs majeurs à la taille du génome (intron, ADN faiblement répété, répété …)) ne sont pas auto-réplicatifs, auto réplicatifs Une part non négligeable de l’ADN non codant est fonctionnel (micro RNA,….), La tolérance pour l’accumulation de l’ADN évolue linéairement avec la taille des cellules. Hypothèse adaptative (1) Théorie du nucléosquelette : sélection directe sur l’ADN Théorie du bodyguard (Hsu 75, Cabvalier-Smith 78) Régulation sectorielle des gènes (Zuckerkandl 76,92,97) • Co-evolution entre taille du noyau y et taille de la cellule,, • L’ADN agit en tant que nucléosquelette autour duquel le noyau est assemblé, • Les cellules de grande taille imposent une pression de sélection sur la taille du noyau (contrainte physique liée au flux de transcrits (production et transport)) MAIS …. Relation de proportionnalité entre la quantité de protéines produites et la taille de la cellule ou la taille du noyau ? Autres mécanismes de régulation de la transcription (nombre de ribosome, durée de vie des transcrits,…) 9 Hypothèse adaptative (2) Relation taille du noyau et taille des hématies (1875) Théorie nucléotypique : sélection indirecte sur l’ADN (Vinogradov 97,98,04,Gregory 01,03,08,09) Erythrocytes La quantité d’ADN non informatif est le produit indirect de la sélection naturelle, La taille du génome est liée au volume nucléaire, à la taille de la cellule et à la vitesse de division cellulaire, composants qui influencent des traits d’histoire de vie comme la vitesse de développement ou l’activité métabolique, Cette théorie adaptative de l’évolution de la taille des génomes repose sur des approches corrélatives entre la taille du génome et des traits phénotypiques sous sélection (nature des pressions, cause ou conséquence ?). Lungfish « Neoceratodus forsteri » 2C=105 pg Poisson « Betta splendens » 2C=1,3 pg Salamandre S l d «A Amphiuma hi means » 2C = 168 pg Homme « Homo sapiens » 2C = 7,0 pg Taille du génome et volume cellulaire au sein des Chordés N=159 N 159 espèces Agnathes Chondrychthyens Urodèles Anoures Téléostéens oiseaux Reptiles Gregory, 2001 10 ADN Taille du génome Noyau Volume nucléaire Rapport Surf cell. / Vol. cell. Cellule Métabolisme énergétique Croissance cellulaire Division cellulaire Cellule de petite taille – Génome de petite taille – Métabolisme énergétique élevé – Division cellulaire rapide Interaction taille du génome et composants cellulaires Niveau de l’organisme ? Relation entre traits d’histoire de vie et taille des génomes chez les homéothermes Relation entre traits d’histoire de vie et taille des génomes chez les homéothermes Quelque soit le niveau taxonomique il existe une relation très forte entre la masse corporelle et le taux métabolique basal. Il existe une relation forte entre la taille des génomes et le taux métaboliq e Cet effet aaugmente métabolique. gmente relativement avec le niveau taxonomique Vinogradov, 95 Vinogradov, 95 11 Taille des génomes et aptitude au vol Chandler, Proc, 2009 Chandler et al Proc R Soc B Correction pour la masse corporelle Passereaux R=0,32 p<0,005 N=74 passereaux Correction pour l’inertie phylogénétique R 0 39 p<0,001 R=0,39 0 001 Relation taille des cellules et taille du génome Bleu : amphibien Marron : mammifère Vert : reptile (non aviaire) Rouge : oiseau Pourquoi les mégachiroptères ont-elle un génome de plus petite taille que les Microchiroptères compte tenu de leur masse corporelle ? Biology Letters, Organ et al 2008 Fossil cell siz Ptérosaure Pté 70 MA avant les oiseaux Inférence de la taille du génome des archosaures Biology Letters, Organ et al 2008 12 Hypothèse adaptative Hypothèse adaptative (2) • Chez les vertébrés homéothermes, il existe un lien corrélatif génomes,, la taille des cellules (érythrocyte, ( y y , entre la taille des g ostéocyte) et l’activité métabolique des organismes. • Ces relations (taille génome/taille cellule) permettent de faire des inférences sur la taille des génomes d’organismes fossiles. Stratégie adaptative : Augmentation de la demande énergétique en relation avec l’activité liée au vol. • Chez les amphibiens, un lien corrélatif a été observé entre la taille du ggénome et le type yp de développement, • Les amphibiens présentant un grand génome, présentent des cellules de grande taille, un cycle cellulaire plus long, une vitesse de croissance et de différenciation plus réduite conduisant à un développement de type néoténique. Stratégie adaptative : Réduction de la demande énergétique en période de limitation des ressources. ADN Taille du génome ADN Taille du génome Noyau Volume nucléaire Noyau Volume nucléaire Rapport Surf cell. / Vol. cell. Cellule Métabolisme énergétique Croissance cellulaire Rapport Surf cell. / Vol. cell. Cellule Division cellulaire Métabolisme énergétique Croissance cellulaire Division cellulaire Stratégie W/F Organisme Vitesse de Développement Métabolisme basal Organisme Longévité Milieu Pressions de sélection Vitesse de Développement Métabolisme basal Longévité Milieu Pressions de sélection 13 Conclusion (1) • La forte variabilité de la taille des génomes due en grande partie à l’amplification des séquences répétées (ETs) conduit à des effets pléïotropes sur des traits soumis à sélection chez l’hôte . • Les corrélations observées – – Au niveau subcellulaire • Taille du noyau, de la cellule • Durée du cycle cellulaire Au niveau organismique • Masse corporelle • Activité métabolique basale (vertébrés homéothermes) • Vitesse de développement • Durée de génération • Durée de la mitose et de la meiose • Taille des grains de pollen • Durée de développement embryonnaire (amphibien) • Complexité morphologique du cerveau (amphibien) • Longévité ? Conclusion (2) • Les mécanismes moléculaires impliqués dans les variations de taille génomique sont : – Biais dans les processus insertion/délétion de l’ADN (cf drosophile, criquet) – Biais dans l’efficacité de réparation de l’ADN – Fréquence des évènements de duplication (géniques ou génomiques) (cf plante, plante poisson) suggèrent fortement que la sélection naturelle joue un rôle important dans l’évolution de la taille des génomes bien que la nature exact des pressions sélections restent à déterminer GBE, 2012 Conclusion (3) • Les variations de taille génomique notamment ll’expansion expansion des rétroéléments voir des duplications sont également conditionnées par : – Pression environnementale (ressources, ….) – Système de reproduction (autogame, allogame) – Taille efficace de la population (masse corporelle) Conclusion • Les deux modèles évolutifs « réduction de Ne » et « effet nucléotypique » agissent simultanément sur la taille des génomes mais à des échelles de temps différentes (niveau taxonomique). • Les forces évolutives qui jouent sur la taille des génomes dépendent de la biologie, de la physiologie et de l’écologie des organismes. 14 Conclusion Evolution de traits moléculaires Composition en Base des Génomes Taux d’évolution Taille des génomes La génomique évolutive Comprendre les processus à l’origine de la dynamique des génomes - nécessaire pour reconstruire l’évolution de la vie - nécessaire pour comprendre le contenu et le fonctionnement des génomes mécanismes moléculaires + processus populationnels + environnement Processus mutationnel Neutre / Dérive génétique Sélection adaptative Non adaptatif / Biais de conversion génique Importance de la taille efficace Relation u (taux de mutation), S (coefficient de sélection), R (taux de recombinaison) et Ne (taille efficace) Relation avec les traits d’histoire de vie Relation Masse corporelle et Ne Relation Masse corporelle, longévité, durée de génération, activité métabolique Réplication (u) Réparation Recombinaison Activité télomérase Remaniement chromosomique Taille de la population Mode d’appariement Sociabilité …….. Latitude Température Rayonnement UV …….. 15