Évolution et phylogénies moléculaires Taxonomie et phylogénie : qqs rappels La classification biologique a pour objectifs : De distinguer et de décrire les espèces actuelles et fossiles D’arranger les espèces décrites en un ordre hiérarchique Linné (1707-1778) Taxinomie (taxonomie) : Science de la classification des organismes Système binomial Taxon (unité taxonomique) : nom de genre et nom d’espèce Le taxonomiste décrit des sp. elles n Activité codifiée Comparer des spécimens de cette sp. avec ceux d’sp. proches En quoi l’sp. nelle se distingue ? De quelles sp. est elle la plus proche ? Anatomie comparée et classification prédarwinienne Les similitudes entre groupes sont soit des homologies soit des analogies Cuvier (1769-1832) Une ressemblance est une analogie si elle peut être expliquée une similitude de fonction ou de mode de vie Les ailes Hydrodynamisme Pour les prédarwinienne les homologies sont attribuable à un plan naturel La pentadactylie : une ressemblance entre sp. que ne justifie aucune nécessité naturelle Évolution La biologie moderne est construite sur la théorie de l’évolution Anatomie, comportement, génomique …etc. : On doit pouvoir apprécier les changements au cours du temps Darwin La classification doit refléter le plus fidèlement possible le déroulement de la généalogie des espèces Cousinage relatif : qui est plus proche de qui ? Cette généalogie s’appelle une phylogénie Taxonomie : Science de la classification des organismes Phylogénie : Évolution d’un groupe d’organismes génétiquement apparentés Étude des relations entre un groupe d’objets biologiques (nucléotides, séquences, gènes, protéines, organes…) qui dérivent d’un ancêtre commun Phylogénie = Classification naturelle Phylogénie → La (vraie) relation entre un groupe (grec = phyla) Arbre évolutif → Visualiser l’évolution à partir d’un ancêtre commun Haeckel 1866 Comparer/Classer des objets Évaluer leur degré de ressemblance et de dissemblance Objets biologiques → Histoire évolutive Ils dérivent d’objet ancestraux Processus continuel de changement avec modification The Tree of Life http://tolweb.org Phylogénie = Reconstruire l’histoire évolutive BUT : Inférer l’histoire passée à l’origine d’un jeu de caractère contemporains BESOINS : Un jeu de caractères (ADN, protéine…etc.) BESOINS : Un modèle évolutif SORTIE : Un arbre évolutif Un arbre comme représentation de la classification du vivant Attention : distinguer phylogénie et arbre généalogique Généalogie → Qui descend de qui ? Phylogénie → Qui est + proche de qui ? Traduit des relations de parentés (degré relatif d’apparentement) Arbre généalogique : les branches relient des ind. bien identifiés Une généalogie est une représentation directe du passé Arbre phylogénétique : seule l’extrémité des branches relient des ind. bien identifiés Les branches relient des ancêtres hypothétiques Phylogénie A partir de comparaisons de données actuelles on reconstitue le passé Confusion phylogénie - généalogie Les darwiniens présentent les fossiles comme des ancêtres identifiés (aux nœuds des arbres) Phylogénie moléculaire Caractères utilisés : Des nucléotides ou des a.a. Ces caractères sont situés sur des séquences Les séquences varient au cours du temps (mutations) Phylogénie moléculaire : qqs balises Hershey & Chase : L’ADN est la molécule qui transmet l’info (1952) Emile Zuckerkandl et Linus Pauling utilisent des séquences d’a.a. pour produire une phylogénie des primates (1962) Le NSF finance le projet “Tree of Life” (2005) Trouver une phylogénie Pas de garantie d’exactitude !! ACGT ACGT Plus d’une façon d’arriver à la même réponse ! AGGT ATGT On observe une distance/différence → On infère une relation AGGT Trouver l’histoire la plus probable !! Principe de parcimonie → Trouver l’arbre qui explique les observations avec le moins de changt possibles Assomption des phylogénie Les séquences divergent par spéciation (représenté par des bifurcation) Les séquences sont indépendantes dès qu’elles divergent de leur ancêtre commun Les différents sites (caractères) dans une séquence évoluent indépendamment A partir d’une séquence d’un ancêtre commun: Deux séquences divergent Elles accumulent des substitutions de nucléotides Le nombre de ces mutations est utilisé pour effectuer une analyse d’évolution moléculaire Relation entre analyse phylogénétique et analyse des séquences Si 2 séquences trouvées dans 2 organismes sont très similaires On assume qu’elles sont dérivées d’un ancêtre commun !! AAGAATC AAGAGTT A A G A (A/G) T (C/T) Quels groupes sont décrits par les phylogénies ? Orang-outan SIV Gorille HIV1/B HIV1/A Chimpanzé Humain HIV1/D ”Arbres d’espèces” Allele A g-tubulin Allele B b-tubulin Allele C a1-tubulin Allele D a2-tubulin ”Arbres de gènes” Quelques exemples Phylogénies - Pourquoi? Comprendre les liens évolutifs qui relient des organismes Analyser les changements survenus au cours de l’évolution des espèces Trouver (et comprendre) les relations entre une séquence ancestrale et ses descendances Évolution de familles de séquences (gènes) Estimer le temps de divergence entre un groupe d’organismes ayant un ancêtre commun Quelles sont les espèces les plus proches de l’homme? 12 MA Données paléontologiques Phylogénie moléculaire (ADN nucléaire et mitochondrial) 5 MA Woese et Fox (1977) Classer les bactéries → Séquences non codante d’ADN ribosomique 2 branches: Eubactéries et Archées La vie a trois domaines Phylogénie des eucaryotes Évolution des gènes à boite MADS chez les plantes vasculaires Évolution des gènes de la globine Phylogénétique appliquée : le cas du dentiste de Floride 1990 : Plusieurs patients soignés par un dentiste HIV+ sont positifs HIV: virus qui évolue très vite On peut reconstruire des patterns à partir de séquences virales Comparer des séquences virales du dentiste, de ses patients + et de contrôles locaux Relation intra espèce : HIV subtypes Rwanda A Ivory Coast B Italy Uganda U.S. U.S. India C U.K. D Ethiopia S. Africa Uganda Uganda Netherlands Tanzania Romania Cameroon Rwanda F Brazil Russia Taiwan Netherlands G Arbre phylogénétique des séquences HIV du dentiste, ses patients et d’individus locaux infectés DENTIST Patient C Patient A Patient G Patient B Patient E Patient A DENTIST YES: The HIV sequences from these patients fall within the clade of HIV sequences found in the dentist. Local control 2 Local control 3 Patient F No Local control 9 Local control 35 Local control 3 Patient D No Les vautours sont ils monophylétiques ? Ordre: Falconiformes Cathartes aura Sarcoramphus papa Vulture gryphus Coragyps atratus Gymnogyps californianus Ordre: Falconiformes ; Famille: Cathartidés Sarcogyps calvus Torgos tracheliotus Gypaetus barbatus Ordre: Falconiformes ; Famille: Accipitridés Morphologie vs. données moléculaires Gyps africain (Gyps fulvus) Vautour de l’ancien monde Condor des Andes (Vulture gryphus) Vautour du nouveau monde Données moléculaires (cytochrome b) Vautours de l’ancien monde → Proches des rapaces diurnes Vautours du nouveau monde → Proches des cigognes Évolution convergentes Mycteria sp. New World vultures (Cathartidae) Classe: Aves Ordre: Ciconiiformes Sousordre: Cathartae Famille: Cathartidae Threskiornis melanocephalus Le parasitisme chez les Angiospermes est t il monophylétique ? Plantes parasites : haustorium Haustorium : racine modifiée Un parenchyme cortical qui entoure un tissu vasculaire. Le tissu vasculaire crée un lien entre les deux cylindres vasculaires Les hémiparasites photosynthétisent pendant une partie de leur cycle : parasites de la sève brute Viscum album Pedicularis canadensis sur racine de Poaceae Les holoparasites sont incapables de photosynthèse Helosis cayennensis (Balanophoraceae) Orobancha sp. Hydnora africana (hydnoraceae) Striga sp. Maïs, sorgho, riz, canne à sucre Une évolution parallèle et convergente Quelle est la meilleure stratégie de renforcement des populations d'ours dans les Pyrénées ? Années 80 - 90 : fort déclin de la population Années 95 : 2 mâles et un ourson Années 96 - 97 : le gouvernement décide de renforcer les populations 2005 : 14 à 18 ours 2006 - 2007 : 4 femelles et un mâle supplémentaire Situation de l'ours en Europe Scandinavie Europe Nord-Est Mt Cantabriques et Pyrénnées Italie (Alpes, Abruzzes) Carpates Balkans Récupèrent des poils d'individus (vivants, captifs, morts) Extraction d'ADN + amplification d'une zone de 269 pb Distance entre les séquences Construction d'un arbre basé sur les distances Phénogramme UPGMA basé sur les distances entre haplotype mitochondriaux Analyse phylogéographrique Des zones refuges Des voies de recolonisation Quelle est la meilleure stratégie de renforcement des populations d'ours dans les Pyrénées ? Qu’est ce qu’un arbre phylogénétique? • Structure mathématique : illustre des relations évolutives entre un groupe d’organismes (de gènes…) • Arbre : Composé de nœuds et de branches • Branche connecte 2 nœuds adjacents • Nœuds : Représentent des unités taxonomiques (séquences, gènes,…) Terminologie Branches: connectent les nœuds de l’arbre Noeud Terminal A B Représentent les Noeud ancestral (racine) TAXA (séquence, gènes, C populations, D espèces, etc.) utilisés Noeuds internes (ou point de divergence) : représentent les ancêtres hypothétiques E Branches externes : se terminent par une feuille Différenciation les + récentes Branches internes : ne se terminent pas par une feuille Différenciation + anciennes 2* 1 * * * 3 Séq. A Nœud 1, 2, 3 → Un évènement de spéciation Séq. B Séq. C Séq. D Nœud 2 → Séquence ancestrale à partir de laquelle séq. A et séq. B ont divergées Nœuds terminaux Données à comparer (séquences) : OTU’s (Operational Taxonomic Units) Nœuds internes Unités taxonomiques ancestrales inférées : HTU’s (Hypothetical Taxonomic Units) Dans un arbre phylogénétique Chaque nœud : un événement de spéciation A partir d’un nœud N’importe quel changement dans une séquence apparaissant chez une espèce est spécifique de cette espèce Topologie d’un arbre Schéma (pattern) de branchement de l’arbre Taxon B Taxon C Taxon A Taxon D Taxon E ((A,(B,C)),(D,E)) = La phylogénie représentée en parenthèses hiérarchisées B et C sont plus proche l’un de l’autre que chacun ne l’est de A A,B et C forment un clade qui est le groupe sœur du clade composé par D et E Pour un nombre fixé d’espèces (séquences) → Plusieurs topologies possibles A B C B A C C A B 3 espèces : 3 arbres D A B C 4 espèces : 5 * 3 arbres n espèces : (2n-3)(2n – 5) (2n – 7) … (3) (1) arbres 10 espèces : 34 106 50 espèces : 2 1076 3 arbres non enracinés possibles pour 4 taxa (A, B, C, D) Arbre 1 Arbre 2 Arbre 3 A C A B A B B D C D D C Inférence phylogénétique : Découvrir quel arbre (parmi les possibles) est correct On veut que ce soit le vrai arbre biologique — Celui qui représente correctement l’histoire évolutive des taxa Trouver la topologie qui correspond au schéma évolutif Trouver l’arbre évolutif correct On utilise les informations contenues dans les séquences On utilise des modèles d’évolution moléculaire Types d’arbres phylogénétiques • • • • Fourché vs. hiérarchique Bifurqué vs. multifurqué Enraciné vs. non enraciné Ultramétrique vs. additif Fourché vs. hiérarchique 1 2 3 4 1 2 3 4 5 6 Inférence phylogénétique : Résoudre l’ordre de branchement des lignées dans un arbre évolutif Complètement non résolu (phylogénie en étoile) Phylogénie partiellement résolue Phylogénie bifurquée totalement résolue A A A B C E C E C D B B E D D Polytomie ou multifurcation Dichotomie ou bifurcation Analyser des relations évolutives entre taxa nécessite d’enraciner un arbre Unrooted tree A Root C Root B D A C Root B B Rooted tree D A C D B A C Root D Arbre enraciné : assigne un ancêtre évolutif Arbre contraint de la racine jusqu’aux taxa contemporains Arbre non enraciné : pas d’ancêtre évolutif Pour 1 arbre non enraciné : plusieurs arbres enracinés Arbres enracinés = Graphe dirigés Liens dirigés : Ils pointent des racines aux feuilles Chimp. Homme Gorille Macaque Arbre non enraciné Chimp. Liens non dirigés Gorille Homme Macaque 4 taxa non enraciné : Peut être théoriquement en 5 endroit ≠ (5 arbres) A Arbre 1 non enraciné: 4 1 B Arbre 1a 2 Arbre 1b C 5 D 3 Arbre 1c Arbre 1d Arbre 1e B A A C D A B B D C C C C A A D D D B B 5 arbres ≠ de relations évolutives entre taxa Chaque arbre non enraciné peut théoriquement être enraciné n’importe où sur ses branches C A D B A C B A B D E C F D E # Taxa 3 4 5 6 7 8 9 . . . . 30 # Unrooted # Rooted Trees x # Roots = Trees 3 1 3 5 3 15 7 15 105 9 105 945 11 945 10,395 13 10,935 135,135 15 135,135 2,027,025 . . . . . . . . . . . . 36 57 ~3.58x 10 ~2.04x 1038 Tous ces réarrangements montrent la même relation évolutive entre taxa B A C D A C D A D B B C D C D A B C A B B C B D D A C A 2 façons principales pour enraciner un arbre: Outgroup Distance du point moyen Outgroup ingroup outgroup Utiliser des taxa dont on sait qu’ils se situent en dehors de l’ingroup (ceux qu’on étudie) Demande une connaissance a priori des relations entre taxa Point moyen d (A,D) = 10 + 3 + 5 = 18 A Point moyen = 18 / 2 = 9 10 3 2 B 2 5 C D Racine : Point moyen des deux taxa les plus distants Assume que les taxa évoluent selon une horloge ! Types d’arbres Les arbres évolutifs mesurent du temps sharks Les phylogrammes mesurent du changement sharks seahorses Root frogs owls 50 million years crocodiles armadillos bats seahorses frogs owls Root crocodiles armadillos 5% change bats Un arbre phylogénétique schématise les relations évolutives entre taxa Taxon B Taxon C Taxon A Taxon D Pas de signification à l’espacement entre taxa ni à l’ordre d’apparition depuis le haut vers le bas Taxon E Cette dimension peut : (1) ne pas avoir d’échelle (‘cladogramme’) (2) Être proportionnelle à la distance génétique (‘phylogramme’) ou à la qté de changnt (‘arbre additif’) (3) Être proportionnel au temps (‘arbre ultramétrique’ ou ‘arbre évolutif vrai’) Trois types d’arbres Phylogramme Cladogramme Arbre ultramétrique 1 6 Taxon B Taxon C 1 3 1 Taxon A Taxon D Pas de sens 5 Taxon B Taxon B Taxon C Taxon C Taxon A Taxon A Taxon D Taxon D Changnt génétique Temps Tous montrent la même relation évolutive (ou ordre de branchement) entre les taxa Ultramétrique Tous les OTUs à distance égale de la racine X a Racine b Additif Distance entre deux OTUs égale à la taille totale des branches entre eux a X b c d a=b+c+d+e e Y c e Y d XY = a + b + c + d + e Dans les scénarios simples, les arbres évolutifs sont ultramétriques et les phylogrammes additifs Analyse phénétique et cladistique Similarité vs. Relation Évolutive: Similarité/Relation : 2 notions ≠ Relation évolutive : inférée à partir de certain type de similarité Similaire : basé sur la ressemblance (une observation) Relatif : génétiquement connecté (un fait historique) 2 taxa peuvent être les + similaires sans être les plus proches évolutivement !! C est plus similaire (en séquence) de A (d=3) que de B (d=7) 1 3 1 5 6 B 1 C A D C et B sont plus relié (C et B ont un ancêtre commun plus récent qu’avec A)