Duplication de genes

publicité
2.
2. Duplication
Duplication de
de gènes
gènes et
et évolution
évolution
des
des familles
familles de
de gènes
gènes
2.1. Evolution de familles de gènes
2.2. Evolution concertée de familles de gènes
2.
2. Duplication
Duplication de
de gènes
gènes et
et évolution
évolution des
des familles
familles de
de gènes
gènes
• Duplication de gènes: évènement fondamental en évolution
moléculaire = source du "bricolage moléculaire"
• Types de duplication:
–
–
–
–
–
duplication d'un segment de gène
duplication entière d'un gène
duplication d'une partie de chromosome
duplication entière d'un chromosome
duplication d'un génome entier Ö polyploïdie
• Cause de duplication: crossing-over inégal
évolution des
génomes
2.
2. Duplication
Duplication de
de gènes
gènes et
et évolution
évolution des
des familles
familles de
de gènes
gènes
• Crossing-over inégal:
Ö Processus plus fréquent dans régions présentant des motifs répétés
(ex. locus VNTR utilisés dans l'identification de criminels)
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• Evolution de gènes dupliqués en entier:
– conservation de la fonction originale Ö copies invariantes:
production en masse de certains ARN et protéines
– émergence d'une nouveauté génétique: une copie conserve sa
fonction initiale, l'autre acquiert une nouvelle fonction
– perte de la fonction originale et dégradation de la séquence
(codon stop, perte TATA box, décalage de cadre de lecture, …):
évolution en pseudogène
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• Evolution de gènes dupliqués en entier:
– L'ensemble des gènes appartenant à un même groupe de séquences
ayant évolué par le processus de duplication = famille de gènes
(incluant copies fonctionnelles et non fonctionnelles)
– Les membres d'une famille de gènes se trouvent généralement à
proximité l'un de l'autre sur le même chromosome, en raison de
leur évolution par crossing-over inégal
Exemple: les familles de gènes de l'α et de la β-globine chez l'homme
pseudogènes
4.1.
4.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• A. Conservation de la fonction originale après duplication :
– "répétitions de dose" favorisées quand justifié par un besoin
métabolique intense pour une molécule donnée:
• ARN ribosomaux, ARN de transfert → répétés en tandem
• protéines ubiquistes comme les histones (lors de divisions cellulaires)
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
B. Emergence d'une nouveauté génétique après duplication: une
copie conserve sa fonction initiale, l'autre diverge et acquiert une
nouvelle fonction
• Exemple: les protéines opsines des pigments rétiniens responsables de la
vision des couleurs
– Chez l'homme + singes de l'ancien monde → ∃ 3 opsines différentes:
• opsine "bleue" (iodopsine S) située sur le chromosome 7 (=autosome)
• opsines "rouge" et "verte" (iodopsine M et L) situées sur le chrom. X
Ö vision trichromatique
Apparus par 2 évènements de duplication:
– 600 Ma: séparation entre iodopsine S et iodopsine "ML" (43% identité séq. a.a.)
Ö vision dichromatique après divergence de S et "ML"
– 35 Ma: séparation entre iodopsine M et L (96% identité séq. a.a.)
Ö vision trichromatique après divergence de M et L
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• Exemple: les protéines opsines des pigments rétiniens responsables de la
vision des couleurs
– Homme + singes de l'ancien monde → ∃ 3 opsines ≠ Ö vision trichromatique :
• opsine "bleue" (iodopsine S) située sur le chromosome 7 (=autosome)
• opsines "rouge" et "verte" (iodopsine M et L) situées sur le chrom. X
– Troubles génétiques de vision des couleurs (daltonisme): altération gène M ou L
• individus ♀: si 1 seule copie porte allèle délétère (hétéroz.) Ö vision normale
• individus ♀: caractère exprimé seulement si homozygote pour allèle délétère
• individus ♂: caractère toujours exprimé car une seule copie du chrom. X
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• Emergence d'une nouvelle fonction après duplication:
–Ex.: vision des couleurs liée à coexistence de 3 types de gènes de
pigmentation de la rétine, issus de duplication.
Copies de gènes →pigments
rouges verts
bleus
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• C. Perte de la fonction originale après duplication et
dégradation de la séquence:
– une des 2 copies conserve la fonction originale, l'autre devient nonfonctionnelle (mutation délétère) Ö évolution en pseudogène
(gène A Ö pseudogène noté ΨA)
– mécanisme de perte de fonction: codon stop, perte TATA box,
décalage de cadre de lecture, perte sites d'épissage,…
– forte probabilité d'évolution en pseudogène après duplication
(la première des 2 copies qui mute Ö pseudogène; l'autre devient un gène à
copie unique) Ö pseudogènes très fréquents (∃ presque toutes
familles de gènes)
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• Datation d'un évènement de duplication:
– 2 gènes sont dits paralogues s'ils dérivent d'un évènement de
duplication (∈ 2 locus distincts dans même génome: α et β)
– 2 gènes sont dits orthologues s'ils dérivent d'un évènement de
spéciation (∈ même locus dans 2 génomes distincts: α espèce 1 et
α espèce 2)
terme "homologue"
imprécis!
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• Datation d'un évènement de duplication:
– on veut estimer TD = temps écoulé depuis duplication menant à α et β
(2 gènes paralogues)
– on connait TS = temps écoulé depuis spéciation menant aux espèces 1
et 2; et les séquences des 2 paires de copies orthologues de α et β
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• Datation d'un évènement de duplication:
– estimation taux substitution moyen: rα = K α /(2TS) avec K α entre 2 espèces;
rmoy= (rα + rβ)/2 Ö hypothèse que même taux substitution entre α et β
– estimation nombre substitutions entre α et β : K αβ = moyenne 4 combinaisons
– calcul final: TD = K αβ /(2rmoy)
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• Exemple d'évolution d'une famille de gènes : les globines
– Composé de 3 sous-familles: myoglobine; α et β–globines
2 protéines : myoglobine (monomérique);
hémoglobine (tétramérique: 2α+2β)
Ö divergence il y a 600-800 106 années
• myoglobine: tissus musculaires
• hémoglobine: sang
Ö duplication puis différenciation
Ö fonction nouvelle
2.1.
2.1. Evolution
Evolution de
de familles
familles de
de gènes
gènes
• Exemple d'évolution d'une famille de gènes : les globines
– Composé de 3 sous-familles: myoglobine; α et β–globines
2 copies quasi-identiques
Ö sur des chromosomes différents
Ö duplication
→ Présence de pseudogènes
sans différenciation
chaînes ξ+ε → hémoglobines de l'embryon et du fetus
Ö duplication puis différenciation Ö fonction nouvelle
2.2.
2.2. Evolution
Evolution concertée
concertée de
de familles
familles de
de gènes
gènes
• Patrons attendus et observés de
variation au sein d'une famille
de gènes comportant 6 gènes
dupliqués en tandem:
– observé: au sein d'une même
espèce, les membres d'une famille
de séquences répétées sont
fortement similaires, alors que les
membres de la même famille
provenant d'espèces apparentées
peuvent être fort différents
Ö évolution concertée des membres
d'une famille de gènes
2.2.
2.2. Evolution
Evolution concertée
concertée de
de familles
familles de
de gènes
gènes
• homogénéisation de la variation au sein d'une famille de gènes
dupliqués en tandem:
– ∃ mécanismes qui copient une nouvelle mutation favorable apparue dans
1 élément répété vers les autres:
• conversion génique
• crossing-over inégal
mutation Æ 1 membre
mutation Æ toute
famille
2.2.
2.2. Evolution
Evolution concertée
concertée de
de familles
familles de
de gènes
gènes
• homogénéisation de la variation au sein d'une famille de gènes
dupliqués en tandem:
– conversion génique
2.2.
2.2. Evolution
Evolution concertée
concertée de
de familles
familles de
de gènes
gènes
• homogénéisation de la variation au sein d'une famille de gènes
dupliqués en tandem:
– crossing-over inégal:
sélection
2.2.
2.2. Evolution
Evolution concertée
concertée de
de familles
familles de
de gènes
gènes
• Evolution concertée des gènes Aγ et Gγ chez les grands singes:
– duplication date de 55 millions d'années, nettement antérieure à la
séparation Homme/Chimpanzé/Gorille
– exon 3: montre patron phylogénétique correspondant au temps de divergence
– exons 1 et 2: évolution concertée dans chaque lignée2
exon 3
exons 1 et 2
Ö évolution concertée avec intensités ≠ dans ≠ régions du gène (contraintes sélectives ≠)
2.2.
2.2. Evolution
Evolution concertée
concertée de
de familles
familles de
de gènes
gènes
• Conséquences évolutives de l'évolution concertée:
– propagation de mutations favorables à l'ensemble des
membres d'une famille de gènes
– retarde la divergence de copies d'un même gène
– complique la datation des évènements de duplication de gènes
3.
3. Polymorphisme
Polymorphisme nucléotidique
nucléotidique
3.1. Polymorphisme nucléotidique intraspécifique
3.2. Polymorphisme nucléotidique transspécifique
3.1.
3.1. Polymorphisme
Polymorphisme nucléotidique
nucléotidique intraspécifique
intraspécifique
• Estimation du polymorphisme moléculaire dans un échantillon de n
séquences tirées de la même espèce
– Estimateur 1: Diversité nucléotidique π
π = Nombre moyen de différences nucléotidiques par site entre deux
séquences de l'échantillon
– Estimateur 2: θw de Watterson
θw = S/(L.a) = Nombre de sites polymorphes dans l'échantillon (S)
divisé par la longueur de la séquence (L) et par facteur normatif a
(a = 1+1/2+1/3+…+1/n-1)
ª Modèle neutre, équilibre dérive/mutation : E(π) = E(θw)
Estimateur 1
π12 = 5/18
π23 = 3/18
π13 = 3/18
<π> = 0.204
b AGC AGT ACC TAA CAC TAG
b AGC TGA ACC TAA AAC TAT
b AGC TGT ACC TTA CAC TAT
Estimateur 2
L = 18
S=5
a = 1.5 et n = 3
θw = S/(L.a) = 0.185
3.1.
3.1. Polymorphisme
Polymorphisme nucléotidique
nucléotidique intraspécifique
intraspécifique
• 11 séquences de l'alcool déshydrogénase chez Drosophile échantillonnées
dans l'espèce D. melanogaster: L = 2379 pb.
(tiré de Graur & Li, 2000)
• variation
nucléotidique concentrée au sein des introns
• nombre de sites polymorphes = S = 43
• nombre de différences nucléotidiques entre séquences 1-S et 2-S = 3
(π12=3/2379=0.0013)
• diversité nucléotidique = moyenne des π ij: π = 0.007
3.1.
3.1. Polymorphisme
Polymorphisme nucléotidique
nucléotidique intraspécifique
intraspécifique
Crustacés
Balance
dérive/mutation
π* = 4Nu
Insectes
Mollusques
Amphibiens
Echinodermes
Reptiles + Oiseaux
Homo sapiens : πs = 0.0007
(Altchuler et al. 2001)
Poissons
Mammifères
(Bazin et al., Science 2006)
Effet de la taille des organismes Î taille des populations N (dérive génétique)
3.1.
3.1.Polymorphisme
Polymorphismenucléotidique
nucléotidiqueintraspécifique
intraspécifique
• Effet d'un goulot d'étranglement associé à la domestication du maïs
Forme sauvage
(téosinte)
Forme sélectionnée
lors de la domestication
3.1.
3.1.Polymorphisme
Polymorphismenucléotidique
nucléotidiqueintraspécifique
intraspécifique
Effet d'un goulot d'étranglement associé à la domestication du maïs:
• comparaison maïs Ù téosinte (ancêtre)
– Ì diversité nucléotidique syn.
<π> = 0.025
πsyn
Téosinte
Maïs
<π> = 0.015
(Ì40%)
3.1.
3.1.Polymorphisme
Polymorphismenucléotidique
nucléotidiqueintraspécifique
intraspécifique
• Effet du système de reproduction
– Evolution de l'autogamie (Ê autofécondation)
Arabidopsis thaliana
Nasrallah et al., 2000,
Plant Physiol. 124: 1605
A. lyrata (allogame)
3.1.
3.1.Polymorphisme
Polymorphismenucléotidique
nucléotidiqueintraspécifique
intraspécifique
– Evolution de l'autogamie chez A. thaliana
Î Ì diversité génétique
(div. nucléotidique synonyme πS)
100% autogamie Î 100% homozygotie
Î réduction par 2 du nombre de copies
de gènes (NeÌ) Î Ê dérive génétique
πSyn.
A. lyrata
A. thaliana
adapté de Charlesworth 2003
Phil. Trans. R. Soc. Lond. B 358:1051
• Effet du système de reproduction
3.1.
3.1.Polymorphisme
Polymorphismenucléotidique
nucléotidiqueintraspécifique
intraspécifique
• Gène sélectionné au cours du processus de domestication: tb1 Æ
dominance apicale chez le maïs
Diversité moléculaire dans la region 5' de tb1 chez maïs et téosinte
Clark, Richard M. et al. (2004) Proc. Natl. Acad. Sci. USA 101, 700-707
Perte diversité drastique dans la région promotrice de tb1 chez maïs:
Î balayage sélectif
Déf.
Déf.Auto-stop
Auto-stopmoléculaire
moléculaire
• Auto-stop moléculaire: phénomène d'association de variants (allèle,
SNP) "neutres" avec les variants d'un locus soumis à sélection
– Cause: liaison génétique (dépend du taux de recombinaison entre
locus neutre et locus sélectionné)
– Conséquences: Ê ou Ì polymorphisme au locus "neutre" par
rapport aux locus "témoins" (non liés au locus sélectionné), selon
le type de sélection naturelle
Liaison
Liaisongénétique
génétiqueetetdéséquilibre
déséquilibrede
deliaison
liaison
•
•
Principe de Hardy-Weinberg → association aléatoire des allèles d'un même locus
Comment s'associent des allèles de locus différents?
– Locus A avec 2 allèles A1 (p1) et A2 (p2)
– Locus B avec 2 allèles B1 (q1) et B2 (q2)
– si association aléatoire Ö 4 types de gamètes: A1B1 (x1); A1B2 (x2); A2B1 (x3); A2B2
(x4)
= x1
= x2
= x3
= x4
→ locus dits "en équilibre de liaison"
(tiré de Hartl, 1994)
Liaison
Liaisongénétique
génétiqueetetdéséquilibre
déséquilibrede
deliaison
liaison
•
Si association des allèles aux locus A et B ne se fait pas de manière aléatoire au sein des
gamètes → locus dits "en déséquilibre de liaison" (sélection, fusion 2 pop., goulet étrangl.)
Ö paramètre supplémentaire: déviation D
D = param. déséquilibre de liaison = x1-p1q1
•
symétrie Ö D = x1.x4-x2.x3
•
Si hypothèses du modèle de H-W Ö les fréquences gamétiques tendent vers équilibre de liaison
mais la vitesse d'approche peut être lente (><1 locus H-W en 1 seule génération !)
Liaison
Liaisongénétique
génétiqueetetdéséquilibre
déséquilibrede
deliaison
liaison
•
Vitessse d'approche → équilibre de liaison dépend du taux de recombinaison entre 2 locus
•
Dn = (1-r)Dn-1 = (1-r)n Do
(tiré de Hartl & Clark, 1997)
Patron
Patron de
de déséquilibre
déséquilibre de
de liaison
liaison
•
Locus ou sites proches le long d'un chromosome
Î Ì taux recombinaison Î Ê déséquilibre de liaison
Déséq.
liaison
Nordborg et al. 2002 Nature Genetics, Arabidopsis thaliana
Patron
Patron de
de déséquilibre
déséquilibre de
de liaison
liaison
Absence
Absence de
de sélection:
sélection: modèle
modèle neutre
neutre
• Le devenir de nouvelles mutations selon la théorie neutraliste de l'évolution
moléculaire (Motoo Kimura)
•
Interaction entre 2 forces évolutives: le processus de mutation-dérive
fréquence mutation
Devenir de mutations neutres (synonymes; non codants)
1
extinction
de la mutation
fixation
de la mutation
(substitution)
0
Echelle de temps évolutive
Absence
Absence de
de sélection:
sélection: modèle
modèle neutre
neutre
Scénario neutre
Temps
Temps de
de fixation
fixation par
par dérive
dérive génétique
génétique d'un
d'un allèle
allèle neutre
neutre
• Si allèle sélectivement neutre Ö devenir est déterminé par la dérive
génétique Ö dépend de N et de sa fréquence actuelle
Fréquences alléliques
tfix
1
élimination d'un
alllèle mutant
fixation d'un
alllèle mutant
0
Temps
•Temps moyen de fixation:
t fix ≈ 4 N générations
Sélection
Sélection directionnelle
directionnelle
Si allèle non neutre Ö devenir est déterminé par la sélection naturelle si N est grand
(sélection > dérive génétique) Ö dépend du coefficient de sélection s:
(en générat°)
t fix = ( 2 / s ) ln( 2 N )
Fréquences alléliques
•
fixation d'un
alllèle mutant
favorable
0
élimination d'un
alllèle mutant favorable
Temps
Exple: mammifère avec N = 106, temps moyen générat° = 2 ans
• nouvelle mutation neutre: tfix = 4x106x2 = 8 millions d'années
• nouvelle mutation favorable avec s = 1%: tfix = 2/0.01xln(2x106)x2 = 5800 ans
Ö Evolution plus rapide sous sélection directionnelle positive!
Auto-stop
Auto-stop moléculaire
moléculaire et
et sélection
sélection
Scénario neutre
Balayage sélectif
sélection
Balayage
Balayage sélectif
sélectif
Effet de l'intensité de la sélection
Balayage
Balayage sélectif
sélectif
• Example: tb1 dominance apicale chez le maïs
Molecular diversity in the 5' region of tb1 in a sample of 24 individuals
Clark, Richard M. et al. (2004) Proc. Natl. Acad. Sci. USA 101, 700-707
Chute de diversité dans la région du promoteur du locus tb1
Î Balayage sélectif
Conséquences
Conséquences des
des balayages
balayages sélectifs
sélectifs
•
Phénomène de variation du taux de recombinaison au travers d'un génome Ö
conséquences sur le niveau de polymorphisme
(tiré de Hartl & Clark, 1997)
Relation entre taux de recombinaison et
polymorphisme chez la Drosophile
2 hypothèses:
• balayage sélectif autour de
locus soumis à une sélection
directionnelle positive
• sélection d'arrière-plan:
élimination d'allèles neutres au
voisinage de locus soumis à
une sélection menant à la
purge d'allèles délétères
Téléchargement