A,D

publicité
Évolution et phylogénies
moléculaires
Taxonomie et phylogénie :
qqs rappels
La classification biologique a
pour objectifs :
De distinguer et de décrire les espèces
actuelles et fossiles
D’arranger les espèces décrites en un ordre
hiérarchique
Linné (1707-1778)
Taxinomie (taxonomie) : Science de la
classification des organismes
Système binomial
Taxon (unité taxonomique) : nom de genre et
nom d’espèce
Le taxonomiste décrit des sp.
elles
n
Activité codifiée
Comparer des spécimens de cette sp. avec
ceux d’sp. proches
En quoi l’sp. nelle se distingue ?
De quelles sp. est elle la plus proche ?
Anatomie comparée et classification
prédarwinienne
Les similitudes entre
groupes sont soit des
homologies soit des
analogies
Cuvier (1769-1832)
Une ressemblance est une analogie si elle
peut être expliquée une similitude de
fonction ou de mode de vie
Les ailes
Hydrodynamisme
Pour les prédarwinienne les homologies sont
attribuable à un plan naturel
La pentadactylie : une ressemblance entre
sp. que ne justifie aucune nécessité
naturelle
Évolution
La biologie moderne est construite sur
la théorie de l’évolution
Anatomie, comportement, génomique …etc. :
On doit pouvoir apprécier les changements au
cours du temps
Darwin
La classification doit refléter le plus
fidèlement possible le déroulement de
la généalogie des espèces
Cousinage relatif : qui est plus proche de qui ?
Cette généalogie s’appelle une phylogénie
Taxonomie : Science de la classification
des organismes
Phylogénie : Évolution d’un groupe
d’organismes génétiquement apparentés
Étude des relations entre un groupe
d’objets biologiques (nucléotides,
séquences, gènes, protéines, organes…)
qui dérivent d’un ancêtre commun
Phylogénie = Classification naturelle
Phylogénie → La (vraie)
relation entre un groupe (grec
= phyla)
Arbre évolutif → Visualiser
l’évolution à partir d’un ancêtre
commun
Haeckel 1866
Comparer/Classer des objets
Évaluer leur degré de ressemblance et
de dissemblance
Objets biologiques → Histoire
évolutive
Ils dérivent d’objet ancestraux
Processus continuel de changement
avec modification
The Tree of Life
http://tolweb.org
Phylogénie = Reconstruire l’histoire
évolutive
BUT : Inférer l’histoire passée à l’origine d’un jeu de
caractère contemporains
BESOINS : Un jeu de caractères (ADN, protéine…etc.)
BESOINS : Un modèle évolutif
SORTIE : Un arbre évolutif
Un arbre comme représentation de la
classification du vivant
Attention : distinguer phylogénie et arbre généalogique
Généalogie → Qui descend de qui ?
Phylogénie → Qui est + proche de qui ?
Traduit des relations de parentés (degré
relatif d’apparentement)
Arbre généalogique : les branches relient des
ind. bien identifiés
Une généalogie est une représentation
directe du passé
Arbre phylogénétique : seule l’extrémité des
branches relient des ind. bien identifiés
Les branches relient des ancêtres
hypothétiques
Phylogénie
A partir de comparaisons de données
actuelles on reconstitue le passé
Confusion phylogénie - généalogie
Les darwiniens présentent les fossiles
comme des ancêtres identifiés (aux nœuds
des arbres)
Phylogénie moléculaire
Caractères utilisés : Des nucléotides ou des
a.a.
Ces caractères sont situés sur des
séquences
Les séquences varient au cours du temps
(mutations)
Phylogénie moléculaire : qqs balises
Hershey & Chase : L’ADN est la molécule qui
transmet l’info (1952)
Emile Zuckerkandl et Linus Pauling utilisent des séquences
d’a.a. pour produire une phylogénie des primates (1962)
Le NSF finance le projet “Tree of Life” (2005)
Trouver une phylogénie
Pas de garantie d’exactitude !!
ACGT
ACGT
Plus d’une façon d’arriver à la même
réponse !
AGGT
ATGT
On observe une distance/différence → On
infère une relation
AGGT
Trouver l’histoire la plus probable !!
Principe de parcimonie → Trouver l’arbre qui explique les
observations avec le moins de changt possibles
Assomption des phylogénie
Les séquences divergent par spéciation (représenté par des
bifurcation)
Les séquences sont indépendantes dès qu’elles divergent de
leur ancêtre commun
Les différents sites (caractères) dans une séquence
évoluent indépendamment
A partir d’une séquence d’un ancêtre
commun:
Deux séquences divergent
Elles accumulent des substitutions de
nucléotides
Le nombre de ces mutations est utilisé pour
effectuer une analyse d’évolution
moléculaire
Relation entre analyse phylogénétique et
analyse des séquences
Si 2 séquences trouvées dans 2 organismes sont
très similaires
On assume qu’elles sont dérivées d’un ancêtre
commun !!
AAGAATC
AAGAGTT
A A G A (A/G) T (C/T)
Quels groupes sont décrits par les
phylogénies ?
Orang-outan
SIV
Gorille
HIV1/B
HIV1/A
Chimpanzé
Humain
HIV1/D
”Arbres d’espèces”
Allele A
g-tubulin
Allele B
b-tubulin
Allele C
a1-tubulin
Allele D
a2-tubulin
”Arbres de gènes”
Quelques exemples
Phylogénies - Pourquoi?
Comprendre les liens évolutifs qui relient des
organismes
Analyser les changements survenus au cours de
l’évolution des espèces
Trouver (et comprendre) les relations entre une
séquence ancestrale et ses descendances
Évolution de familles de séquences (gènes)
Estimer le temps de divergence entre un groupe
d’organismes ayant un ancêtre commun
Quelles sont les espèces les
plus proches de l’homme?
12 MA
Données paléontologiques
Phylogénie moléculaire (ADN nucléaire et
mitochondrial)
5 MA
Woese et Fox (1977)
Classer les bactéries → Séquences non
codante d’ADN ribosomique
2 branches: Eubactéries et
Archées
La vie a trois domaines
Phylogénie des eucaryotes
Évolution des gènes à boite MADS chez les
plantes vasculaires
Évolution des gènes de
la globine
Phylogénétique appliquée :
le cas du dentiste de Floride
1990 : Plusieurs patients
soignés par un dentiste HIV+
sont positifs
HIV: virus qui évolue très
vite
On peut reconstruire des patterns à partir de séquences
virales
Comparer des séquences virales du dentiste, de ses
patients + et de contrôles locaux
Relation intra espèce :
HIV subtypes
Rwanda
A
Ivory Coast
B
Italy
Uganda
U.S.
U.S.
India
C
U.K.
D
Ethiopia
S. Africa
Uganda
Uganda
Netherlands
Tanzania
Romania
Cameroon
Rwanda
F
Brazil
Russia
Taiwan
Netherlands
G
Arbre phylogénétique des séquences HIV du dentiste,
ses patients et d’individus locaux infectés
DENTIST
Patient C
Patient A
Patient G
Patient B
Patient E
Patient A
DENTIST
YES:
The HIV sequences from
these patients fall within
the clade of HIV sequences
found in the dentist.
Local control 2
Local control 3
Patient F
No
Local control 9
Local control 35
Local control 3
Patient D
No
Les vautours sont ils
monophylétiques ?
Ordre: Falconiformes
Cathartes aura
Sarcoramphus papa
Vulture gryphus
Coragyps atratus
Gymnogyps californianus
Ordre: Falconiformes ; Famille: Cathartidés
Sarcogyps calvus
Torgos tracheliotus
Gypaetus barbatus
Ordre: Falconiformes ; Famille: Accipitridés
Morphologie vs. données moléculaires
Gyps africain (Gyps fulvus)
Vautour de l’ancien monde
Condor des Andes (Vulture gryphus)
Vautour du nouveau monde
Données moléculaires (cytochrome b)
Vautours de l’ancien monde → Proches des rapaces diurnes
Vautours du nouveau monde → Proches des cigognes
Évolution convergentes
Mycteria sp.
New World vultures (Cathartidae)
Classe: Aves
Ordre: Ciconiiformes
Sousordre: Cathartae
Famille: Cathartidae
Threskiornis melanocephalus
Le parasitisme chez les Angiospermes
est t il monophylétique ?
Plantes parasites : haustorium
Haustorium : racine modifiée
Un parenchyme cortical qui entoure un tissu vasculaire.
Le tissu vasculaire crée un lien entre les deux
cylindres vasculaires
Les hémiparasites photosynthétisent
pendant une partie de leur cycle : parasites
de la sève brute
Viscum album
Pedicularis canadensis sur racine de Poaceae
Les holoparasites sont incapables de
photosynthèse
Helosis cayennensis
(Balanophoraceae)
Orobancha sp.
Hydnora africana
(hydnoraceae)
Striga sp.
Maïs, sorgho, riz, canne à sucre
Une évolution
parallèle et
convergente
Quelle est la meilleure stratégie de
renforcement des populations d'ours dans
les Pyrénées ?
Années 80 - 90 : fort déclin de
la population
Années 95 : 2 mâles et un
ourson
Années 96 - 97 : le gouvernement décide de renforcer les
populations
2005 : 14 à 18 ours
2006 - 2007 : 4 femelles et un mâle supplémentaire
Situation de l'ours en Europe
Scandinavie
Europe
Nord-Est
Mt Cantabriques et
Pyrénnées
Italie (Alpes, Abruzzes)
Carpates
Balkans
Récupèrent des poils d'individus (vivants, captifs, morts)
Extraction d'ADN + amplification d'une zone de 269 pb
Distance entre les séquences
Construction d'un arbre basé
sur les distances
Phénogramme UPGMA basé sur les distances entre
haplotype mitochondriaux
Analyse
phylogéographrique
Des zones refuges
Des voies de
recolonisation
Quelle est la meilleure stratégie de
renforcement des populations d'ours dans
les Pyrénées ?
Qu’est ce qu’un arbre
phylogénétique?
• Structure mathématique : illustre des
relations évolutives entre un groupe
d’organismes (de gènes…)
• Arbre : Composé de nœuds et de branches
• Branche connecte 2 nœuds adjacents
• Nœuds : Représentent des unités
taxonomiques (séquences, gènes,…)
Terminologie
Branches: connectent les
nœuds de l’arbre
Noeud Terminal
A
B Représentent les
Noeud
ancestral
(racine)
TAXA (séquence,
gènes,
C
populations,
D espèces, etc.)
utilisés
Noeuds internes (ou
point de divergence) :
représentent les
ancêtres hypothétiques
E
Branches externes : se terminent par une
feuille
Différenciation les + récentes
Branches internes : ne se terminent pas
par une feuille
Différenciation + anciennes
2*
1
*
*
*
3
Séq. A
Nœud 1, 2, 3 → Un
évènement de spéciation
Séq. B
Séq. C
Séq. D
Nœud 2 → Séquence
ancestrale à partir de laquelle
séq. A et séq. B ont
divergées
Nœuds terminaux
Données à comparer (séquences) : OTU’s
(Operational Taxonomic Units)
Nœuds internes
Unités taxonomiques ancestrales inférées :
HTU’s
(Hypothetical Taxonomic Units)
Dans un arbre phylogénétique
Chaque nœud : un événement de spéciation
A partir d’un nœud
N’importe quel changement dans une
séquence apparaissant chez une espèce
est spécifique de cette espèce
Topologie d’un arbre
Schéma (pattern) de branchement de l’arbre
Taxon B
Taxon C
Taxon A
Taxon D
Taxon E
((A,(B,C)),(D,E)) = La phylogénie représentée en
parenthèses hiérarchisées
B et C sont plus proche l’un de l’autre que chacun ne
l’est de A
A,B et C forment un clade qui est le groupe sœur du
clade composé par D et E
Pour un nombre fixé d’espèces (séquences)
→ Plusieurs topologies possibles
A B C
B A C
C A B
3 espèces : 3 arbres
D A B C
4 espèces : 5 * 3 arbres
n espèces : (2n-3)(2n – 5) (2n – 7) … (3) (1) arbres
10 espèces : 34 106
50 espèces : 2 1076
3 arbres non enracinés possibles pour 4
taxa (A, B, C, D)
Arbre 1
Arbre 2
Arbre 3
A
C
A
B
A
B
B
D
C
D
D
C
Inférence phylogénétique : Découvrir quel arbre (parmi
les possibles) est correct
On veut que ce soit le vrai arbre biologique — Celui qui
représente correctement l’histoire évolutive des taxa
Trouver la topologie qui correspond au
schéma évolutif
Trouver l’arbre évolutif correct
On utilise les informations contenues
dans les séquences
On utilise des modèles d’évolution
moléculaire
Types d’arbres phylogénétiques
•
•
•
•
Fourché vs. hiérarchique
Bifurqué vs. multifurqué
Enraciné vs. non enraciné
Ultramétrique vs. additif
Fourché vs. hiérarchique
1
2
3
4
1
2
3
4
5
6
Inférence phylogénétique : Résoudre
l’ordre de branchement des lignées dans
un arbre évolutif
Complètement non résolu
(phylogénie en étoile)
Phylogénie
partiellement résolue
Phylogénie bifurquée
totalement résolue
A
A
A
B
C
E
C
E
C
D
B
B
E
D
D
Polytomie ou multifurcation
Dichotomie ou bifurcation
Analyser des relations évolutives entre
taxa nécessite d’enraciner un arbre
Unrooted tree
A
Root
C
Root
B
D
A
C
Root
B
B
Rooted tree
D
A C
D
B
A
C
Root
D
Arbre enraciné : assigne un ancêtre
évolutif
Arbre contraint de la racine jusqu’aux
taxa contemporains
Arbre non enraciné : pas d’ancêtre évolutif
Pour 1 arbre non enraciné : plusieurs arbres
enracinés
Arbres enracinés = Graphe dirigés
Liens dirigés : Ils pointent des racines aux feuilles
Chimp.
Homme Gorille Macaque
Arbre non enraciné
Chimp.
Liens non dirigés
Gorille
Homme
Macaque
4 taxa non enraciné : Peut être théoriquement en 5
endroit ≠ (5 arbres)
A
Arbre 1 non
enraciné:
4
1
B
Arbre 1a
2
Arbre 1b
C
5
D
3
Arbre 1c
Arbre 1d
Arbre 1e
B
A
A
C
D
A
B
B
D
C
C
C
C
A
A
D
D
D
B
B
5 arbres ≠ de relations évolutives entre taxa
Chaque arbre non enraciné peut
théoriquement être enraciné n’importe où
sur ses branches
C
A
D
B
A
C
B
A
B
D
E
C
F
D
E
# Taxa
3
4
5
6
7
8
9
.
.
.
.
30
# Unrooted
# Rooted
Trees x # Roots =
Trees
3
1
3
5
3
15
7
15
105
9
105
945
11
945
10,395
13
10,935
135,135
15
135,135
2,027,025
.
.
.
.
.
.
.
.
.
.
.
.
36
57
~3.58x 10
~2.04x 1038
Tous ces réarrangements montrent la même relation
évolutive entre taxa
B
A
C
D
A
C
D
A
D
B
B
C
D
C
D
A
B
C
A
B
B
C
B
D
D
A
C
A
2 façons principales pour enraciner un
arbre:
Outgroup
Distance du point moyen
Outgroup
ingroup
outgroup
Utiliser des taxa dont on sait qu’ils se situent en
dehors de l’ingroup (ceux qu’on étudie)
Demande une connaissance a priori des relations
entre taxa
Point moyen
d (A,D) = 10 + 3 + 5 = 18
A
Point moyen = 18 / 2 = 9
10
3
2
B 2
5
C
D
Racine : Point moyen des deux taxa les plus
distants
Assume que les taxa évoluent selon une horloge !
Types d’arbres
Les arbres évolutifs
mesurent du temps
sharks
Les phylogrammes
mesurent du
changement
sharks
seahorses
Root
frogs
owls
50 million years
crocodiles
armadillos
bats
seahorses
frogs
owls
Root
crocodiles
armadillos
5% change
bats
Un arbre phylogénétique schématise les
relations évolutives entre taxa
Taxon B
Taxon C
Taxon A
Taxon D
Pas de signification à
l’espacement entre taxa ni à
l’ordre d’apparition depuis
le haut vers le bas
Taxon E
Cette dimension peut :
(1) ne pas avoir d’échelle (‘cladogramme’)
(2) Être proportionnelle à la distance génétique
(‘phylogramme’) ou à la qté de changnt (‘arbre additif’)
(3) Être proportionnel au temps (‘arbre ultramétrique’ ou
‘arbre évolutif vrai’)
Trois types d’arbres
Phylogramme
Cladogramme
Arbre
ultramétrique
1
6
Taxon B
Taxon C
1
3
1
Taxon A
Taxon D
Pas de sens
5
Taxon B
Taxon B
Taxon C
Taxon C
Taxon A
Taxon A
Taxon D
Taxon D
Changnt génétique
Temps
Tous montrent la même relation évolutive
(ou ordre de branchement) entre les taxa
Ultramétrique
Tous les OTUs à distance
égale de la racine
X
a
Racine
b
Additif
Distance entre deux OTUs
égale à la taille totale des
branches entre eux
a X
b
c d
a=b+c+d+e
e Y
c
e
Y
d
XY = a + b + c + d + e
Dans les scénarios simples, les arbres évolutifs sont
ultramétriques et les phylogrammes additifs
Analyse phénétique et
cladistique
Similarité vs. Relation Évolutive:
Similarité/Relation : 2 notions ≠
Relation évolutive : inférée à partir de
certain type de similarité
Similaire : basé sur la ressemblance (une
observation)
Relatif : génétiquement connecté (un fait
historique)
2 taxa peuvent être les + similaires sans
être les plus proches évolutivement !!
C est plus similaire (en séquence)
de A (d=3) que de B (d=7)
1
3
1
5
6
B
1 C
A
D
C et B sont plus relié (C et B
ont un ancêtre commun plus
récent qu’avec A)
Téléchargement