Evolution Moléculaire et Phylogénie Dominique Mouchiroud [email protected] Biométrie et Biologie Evolutive, UMR5558, Lyon I Bioinformatique et Génomique Evolutive Plan du cours I. L’évolution moléculaire Cadre théorique II. Evolution de quelques traits moléculaires Taille des génomes Composition en base des génomes Taux d’évolution III. Conclusion Traits moléculaires La génomique évolutive mécanismes moléculaires + processus populationnels + environnement Réplication (u) Réparation Recombinaison Activité télomérase Remaniement chromosomique Taille de la population Mode d’appariement Comportement Ecologie de l’organisme …….. Latitude Température Rayonnement UV …….. Plan du cours II. Evolution de quelques traits moléculaires Taille des génomes Variation et paradoxe de la valeur C Modèles d’évolution : - Hypothèse neutre - Hypothèse adaptative - Hypothèse non adaptative - Conclusion : toujours un mystère ? ANIMAL GENOME SIZE DATABASE http://www.genomesize.com/ Dr. T Ryan Gregory université de Guelph, ontario, canada "Il est hors de doute que l’étude systématique, de la teneur absolue du noyau en acide désoxyribonucléique, à travers de nombreuses espèces animales, puisse fournir des suggestions intéressantes en ce qui concerne le problème de l’évolution." - Vendrely and Vendrely, 1950 Welcome to the Animal Genome Size Database, Release 2.0, a comprehensive catalogue of animal genome size data. Haploid DNA contents (C-values, in picograms) are currently available for 5635 species (3731 vertebrates and 1904 non-vertebrates) based on 7286 records from 683 published sources. You can navigate the database using the menu on the left. New features in Release 2.0 include enhanced browsing and search functions, data export capabilities, up to the minute summaries of available data, and a new genome size discussion forum. Taille des génomes et paradoxe de la valeur C Archées 0,491 – 5,751 Mb Eubactéries 0,16 – 13,034 Mb Eucaryotes 2,249 – 978 000 Mb Taille des génomes et paradoxe de la valeur C http://www.genomesize.com 1pg = 978 Mb Comparaison de différents génomes de Vertébrés Dérive génétique ou pression de sélection ? Protopterus aethiopicus 139 000 Mb Xenopus laevis Fugu rubripes 3 100 Mb 400 Mb Cercopithecus cephus 5 200 Mb Homo sapiens 2 900 Mb Amphiuma means 84 000 Mb Comparaison de différents génomes de Vertébrés Temps en millions d’années 600 400 200 Tailles moyennes (pg) Ecart types (pg) 3 3,8 1,61 Chondrichthyens 10 14,6 10,66 Actinoptérygiens 108 2,6 1,26 3 222,0 62,04 Anoures 28 9 4,79 Urodèles Mammifères non-chiroptères Chiroptères 40 75,8 34,18 95 7 1,14 26 5 0,83 Testudines 14 6,1 1,46 Oiseaux 102 2,9 0,31 2 5,8 1,13 67 4,4 1,3 Nombre de genres utilisés 0 Agnathes Dipneustes Tétrapodes Crocodiliens Lépidosauriens La taill e du géno me est généralement exprimée en picogramme (10-12g) par génome haploïde (la valeur C, noté C) ou diploïde (2 fois la valeur C, noté 2C) en sachant que 1 pg correspond à 0,98x10 9 pb d’ADN doub le brin. ? Comparaison de différents génomes procaryotes Sorangium cellulosum Gram négatif Myxobactérie du sol 13 034Kb – 10 000 gènes Schneiker et al Nature biotech. 2007 Candidatus Carsonella ruddii Gamma bactérie Endosymbiote des psyllides 159Kb – 182 protéines Nakabachi A science 2006 ? Nanoarchaeum equitans Archée symbiote parasite D’une autre archée Ignicoccus 490Kb – 536 gènes Sabyasachi BMC Genomics 2006 Wernegreen , Nature Review in Genetics 2002 Methanosarcina acetivorans Archée producteur de méthane 5 751 Kb – 4524 protéines Comparaison de différents génomes eucaryotes Muntiacus muntjak vaginalis Muntiacus reevesi 6 46 Chinois Indien INDIEN CHINOIS Variation de la taille des génomes • La taille des génomes varie entre espèces, • Sans relation avec le niveau de complexité de l’organisme (nbre de tissus) “paradoxe C” • (ex. Homo sapiens 3 Gb : Amoeba dubia 670 Gb) • sans relation avec le nombre de chromosomes • (ex Muntiacus muntjak vaginalis 6 chr. : Muntiacus reevesi 46 chr) • sans relation avec le nombre de gènes “paradoxe G” • (ex Drosophile 13 700 gènes, Nématode 20500 gènes, Paramécie 40 000 gènes) • Solution La taille des génomes est déterminée par le packaging des gènes” (introns, séquences répétées, junk DNA, etc). Proportion d’ADN non codant • • ADN informatif – gènes protéiques – code pour ARNt – ARNr-ARNn – Régions régulatrices ADN non informatif – séquences répétées • (ET, CNV, microsatellite) Procaryotes Eucaryotes ADN informatif et non informatif Gregory, Nature Reviews Genetics, 2005 Le turnover génomique Amplification • La duplication génomique ou polyploïdisation, • La duplication chromosomique, • La duplication génique par recombinaison inégale (ectopique), • La transposition et la retrotransposition (pour ETs), • Les transferts horizontaux (chez les procaryotes), • La création de nouveaux gènes. Contraction La délétion génique par recombinaison inégale (ectopique) Les microdélétions par dérapage de la polymérase Le turnover génomique Une très forte activité des transposons a conduit à un doublement du génome du maïs 1,2 billions à 2,4 billions (conséquence de la domestication). Chez la drosophile, le taux de délétion de l’ADN est 60 plus élevé que chez les mammifères alors que le criquet (Laupala) qui a un taux de délétion 40 fois plus lent, a un génome 11 fois plus important. Mol Biol Evol. 2001. Genomic gigantism: DNA loss is slow in mountain grasshoppers. Bensasson D, Petrov DA, Zhang DX, Hartl DL, Hewitt GM. Mécanismes moléculaires Processus populationnel Turnover génomique Mutations germinales Phénotype Ne Fixation Plan du cours II. Evolution de quelques traits moléculaires Taille des génomes Variation et paradoxe de la valeur C Modèles d’évolution : - Hypothèse neutre - Hypothèse adaptative - Hypothèse non adaptative - Conclusion : toujours un mystère ? Hypothèse neutraliste de la variation de taille du génome Théorie de l’ADN égoïste (selfish DNA theory) (Doolittle and Sapeinza (1980) – Orgel and Crick (1980) La majeur partie de l’ADN est constituée d’éléments capables de proliférer sans affecter la fitness de l’organisme (ADN égoïste). La théorie de l’ADN égoïste n’explique pas les contractions et amplifications propres à certains génomes. Hypothèse adaptative de la variation de taille du génome Théorie nucléotypique : sélection indirecte sur l’ADN (Vinogradov AE 97,98,04, 06, Gregory TR 01,03,08,09, 13) La quantité d’ADN non informatif est le produit indirect de la sélection naturelle, La taille du génome est liée au volume nucléaire, à la taille de la cellule et à la vitesse de division cellulaire, composants qui influencent des traits d’histoire de vie comme la vitesse de développement ou l’activité métabolique, Cette théorie adaptative de l’évolution de la taille des génomes repose sur des approches corrélatives entre la taille du génome et des traits phénotypiques sous sélection (nature des pressions, cause ou conséquence ?). Relation taille du noyau et taille des érythrocytes (1875) Erythrocytes Dipneuste d’Australie « Neoceratodus forsteri » 2C=105 pg Poisson « Betta splendens » 2C=1,3 pg Salamandre « Amphiuma means » 2C = 168 pg Homme « Homo sapiens » 2C = 7,0 pg Taille du génome et volume cellulaire au sein des Chordés N=159 espèces Agnathes Chondrychthyens Urodèles Anoures Téléostéens oiseaux Reptiles Gregory, 2001 Gregory, 2001 Modèle d’évolution de la taille des génomes Physiologie Trait moléculaire Turnover génomique Relation entre traits d’histoire de vie et taille des génomes Au sein des mammifères, il existe une relation inverse entre la masse corporelle et le taux métabolique basale et ceci quelque soit le niveau taxonomique (ordre, genre, espèce) (Vinogradov 95, 2004). En corrigeant le taux métabolique par la masse corporelle, il existe une relation inverse entre la taille du génome et le taux métabolique basal. Une relation similaire a été observée chez les oiseaux. Un effet similaire est observé avec la masse cardiaque (Vinogradov, 2006). Cette relation s’étend également aux poïkilothermes. Vinogradov, 2006 Oiseau Mammifère Amphibien Reptile Vinogradov, 95 Chez les oiseaux, la taille des génomes a été mise en relation avec - l’aptitude au vol (Gregory, 2002) - l’envergure des ailes chez les passereaux (Chandler, Proc, 2009) Colibri Des travaux utilisent la taille des cellules comme proxy de la taille des génomes permettant d’inférer ce trait moléculaire chez des organismes disparus. Ptérosaure 70 MA avant les oiseaux Bleu : amphibien Marron : mammifère Vert : reptile (non aviaire) Rouge : oiseau Biology Letters, Organ et al 2008 Biology Letters, Organ et al 2008 Fossil cell size Vert : archosaure- ptérosaure Rouge : oiseau Marron : chauve-souris - Inférence de la taille du génome des archosaures. - Réduction de la taille des génomes prédate l’acquisition du vol. Chez les vertébrés homéothermes, il existe un lien corrélatif entre la taille des génomes, la taille des cellules (érythrocyte, ostéocyte) et l’activité métabolique des organismes. Chez les oiseaux, la faible taille des génomes est mise en relation avec la forte demande énergétique liée au vol. Chez les amphibiens, la très grande taille des génomes chez les urodèles est associée à des cellules de grande taille, un cycle cellulaire plus long, une vitesse de croissance et de différenciation plus réduite conduisant à un développement de type néoténique (Gregory, BJLS, 2003, Laurin et al, 2015). Modèle adaptatif de la variation de taille des génomes • La forte variabilité de la taille des génomes due en grande partie à l’amplification des séquences répétées (ETs) conduit à des effets pléïotropes sur des traits soumis à sélection chez l’hôte . • Les corrélations observées • • Au niveau subcellulaire • Taille du noyau, de la cellule • Durée du cycle cellulaire Au niveau organismique • Masse corporelle • Activité métabolique basale (vertébrés homéothermes) • Vitesse de développement • Durée de génération • Durée de la mitose et de la meiose • Taille des grains de pollen • Durée de développement embryonnaire (amphibien) • Complexité morphologique du cerveau (amphibien) • Longévité ? suggèrent fortement que la sélection naturelle joue un rôle important dans l’évolution de la taille des génomes bien que la nature exact des pressions sélections restent à déterminer ADN Noyau Taille du génome Volume nucléaire Rapport Surf cell. / Vol. cell. Cellule Métabolisme énergétique Croissance cellulaire Organisme Vitesse de Développement Division cellulaire Métabolisme basal Longévité Milieu Pressions de sélection ADN Noyau Taille du génome Volume nucléaire Rapport Surf cell. / Vol. cell. Cellule Métabolisme énergétique Croissance cellulaire Division cellulaire Stratégie Wasteful/Frugal Organisme Vitesse de Développement Métabolisme basal Longévité Milieu Pressions de sélection • Les mécanismes moléculaires impliqués dans les variations de taille génomique sont : • Biais dans les processus insertion/délétion de l’ADN (cf drosophile, criquet) • Biais dans l’efficacité de réparation de l’ADN • Fréquence des évènements de duplication (géniques ou génomiques) (cf plante, poisson) GBE, 2012 • Les variations de taille génomique notamment l’expansion des rétroéléments voir des duplications sont également conditionnées par : • Pression environnementale (ressources, ….) • Système de reproduction (autogame, allogame) • Taille efficace de la population (masse corporelle) Hypothèse non adaptative de la variation de taille du génome Théorie non adaptative : impact de la taille efficace Ne (Lynch 03,06, 10, 11, 12 ,Whitney 10) Michael Lynch (1960) Professeur à l’université du Minnesota Rôle essentiel de la dérive génétique et des mutations délétères (processus non adaptatif) dans la mise en place de la complexité des génomes des organismes vivants. The Evolution of Genome Complexity. Despite the common view that a causal link exists between complexity at the genomic and organismal levels, little thought has gone into the mechanisms that are responsible for the origin of the fundamental features of the eukaryotic genome. Using population-genetic principles as a guide to understanding the evolution of duplicate genes, introns, mobile-genetic elements, and regulatory-region complexity, our work is advancing the hypothesis that much of eukaryotic genomic complexity initially evolved as a passive indirect response to reduced population size (relative to the situation in prokaryotes). Expansion du nombre de gènes avec l’évolution de la multicellularité Cause ou Effet ? Vertebrata 30,000 – 50,000 Urochordata 16,000 Arthropoda 14,000 Nematoda 21,000 Fungi 2,000 – 13,000 Vascular plants 25,000 – 60,000 Unicellular sps. 5,000 – 10,000 Prokaryotes 500 - 7,000 Modèle d’évolution neutre A l’équilibre, le nombre moyen de mutations fixées (substitutions) aux sites neutres est égal au nombre moyen de mutations qui ségrègent dans la population, Le taux de polymorphisme ou diversité génétique attendu sous le modèle neutre est égal à 4Neµ / prop à Neµ avec µ : taux de mutation Ne : nombres d’allèles par génome haploïde sous l’hypothèse d’une population infinie d’allèle La diversité génétique (taux de polymorphisme) mesurée pour chaque organisme est donc un bon estimateur de Neµ m = 5 10-11 – 5 10-10 Ne > 108 107 > Ne > 108 105 > Ne > 106 104 > Ne > 105 Lynch M, science 2003 Modèle de Lynch : mutational hazard hypothesis L’augmentation globale de la taille des génomes et conjointement du nombre de gènes des procaryotes jusqu’aux eucaryotes multicellulaires est liée à une réduction très importante de la taille efficace des populations qui ont conduit à une augmentation de la dérive génétique. La dérive génétique a eu comme conséquence la prolifération de composants génomiques (séquences répétées, éléments dupliquées, etc) non éliminés par la sélection naturelle. Génomes de grande taille impliquent des chromosomes de grande taille d’où des taux de recombinaison plus faibles par chromosome et donc un fardeau génétique plus important. Hypothèse non adaptative La structuration complexe des génomes apparaît comme une réponse pathologique à une faible taille efficace et à la présence de mutations délétaires : • • • • Augmentation du nombre de gène – rétention des gènes dupliqués. Régions régulatrices modulaires plus complexes. Prolifération des introns (nucléaire) Transposons et retrotransposons. L’évolution adaptative est une conséquence secondaire d’une telle complexité. Plan du cours II. Evolution de quelques traits moléculaires Taille des génomes Variation et paradoxe de la valeur C Modèles d’évolution : - Hypothèse neutre - Hypothèse adaptative - Hypothèse non adaptative - Conclusion : toujours un mystère ? Ne : paramètre clé pour la dynamique des génomes Ne estimée à partir de données de polymorphisme : PS prop Ne u Ne récent – nécessité d’un marqueur neutre Ne estimée à partir de données de divergence : dN/dS prop à Ne s si Ne élevée, sélection, purge des mutations délétères : dN/dS faible si Ne faible, dérive génétique, fixation de mutations délétères : dN/dS élevé Ne plus ancien – dépend de la fonction du gène – nécessité dS marqueur neutre (pas vrai si biais d’usage du code) Ne estimée à partir de la masse corporelle : relation inverse avec M Ne récent Problèmes avec l’estimation de Neu (Lynch, 2003) - utilisation de la diversité actuelle aux sites silencieux (Daubin and Moran 2004 ) impact de la structure de la population impact du cycle de vie – système de reproduction - taux de mutation (u) diffère selon les taxons - taille efficace Ne est un facteur confondant (masse corporelle, reproduction, etc) - échantillonnage taxonomique réduit (peu d’espèces de grande taille) - pas prise en compte de l’inertie phylogénétique (Whitney – Garland, Plos Genetic 2010, 2011) Relation taille/GC des génomes procaryotes Génome de grande taille, organisme dans environnement variable : Exemple des bactéries libres Caractéristique : Ne élevée E. Coli Ne entre 108-1010 – 4000 gènes Buchnera aphicola Ne = 107 – 618 gènes Données (Wernegreen 2015) Génome de petite taille, organisme dans environnement stable : Exemple des bactéries endosymbiotiques Caractéristique : Ne faible Reductive genome evolution at both ends of the bacterial population size spectrum Bérénice Batut, Carole Knibbe, Gabriel Marais and Vincent Daubin Endosymbiote / bactérie libre E. Coli Buchnera aphidicola 86% réduction recombinaison 26% GC contre 50% GC Cyanobactérie marine : écotype en fonction nutriment Prochlorococcus spp 38% réduction 30,8% GC contre 50 % GC Ne=107 perte des gènes de la Ne=1011 pas perte des gènes de la recombinaison Modèle d’évolution de Lynch Modèle de Lynch : Taille des génomes augmente avec l’effet de la dérive génétique (diminution de Ne) Attendus : - relation < 0 entre la taille des génomes et la diversité génétique (Ps) (diminution de Ne, diminution de la diversité, augmentation de la taille des génomes) - relation > 0 entre la taille des génomes et la divergence (dN/dS) (diminution de Ne, augmentation de la divergence, augmentation de la taille des génomes) Observations (Batut et al 2014) : - Pas de relation significative entre le taux de diversité et la taille des génomes (courbe rouge) - Génome de Prochlorococcus se caractérise par un taux de polymorphisme très élevé (lié à une taille efficace importante) pour une taille de génome très faible. - Relation >0 avec l’inverse de la divergence (dS/dN) donc inverse à ce qui est attendu avec le modèle de Lynch (courbe bleu). Conclusions(1) Ne présente des effets opposés sur la taille des génomes eucaryotes et procaryotes liés aux effets de la dérive génétique. - augmentation de la taille des génomes eucaryotes avec la diminution de la taille efficace (modèle de Lynch), - diminution de la taille des génomes procaryotes (bactéries endosymbiotiques) avec la diminution de la taille efficace. Hypothèse : patron de mutation différent - biais insertion/délétion - procaryote : biais vers délétion de petites tailles - eucaryote : pas de biais Existence de bactéries libres qui montrent les effets de réduction de taille identique à celles des bactéries endosymbiotiques (Batut 2014). - Cas de Prochlorococcus marinus (écotype avec Ne élevé 109-1011). Hypothèse : contrainte environnementale - adaptation (sélection) à un environnement pauvre en nutriment – réduction de taille de cellule . Conclusion (2) • Les deux modèles évolutifs « Adaptatif et non adaptatif» agissent simultanément sur la taille des génomes mais à des échelles de temps différentes (niveau taxonomique). • Les forces évolutives qui jouent sur la taille des génomes dépendent de la biologie, de la physiologie et de l’écologie des organismes. La génomique évolutive mécanismes moléculaires + processus populationnels + environnement Réplication (u) Réparation Recombinaison Activité télomérase Remaniement chromosomique Taille de la population Mode d’appariement Comportement Ecologie de l’organisme …….. Latitude Température Rayonnement UV ……..