2. 2. Duplication Duplication de de gènes gènes et et évolution évolution des des familles familles de de gènes gènes 2.1. Evolution de familles de gènes 2.2. Evolution concertée de familles de gènes 2. 2. Duplication Duplication de de gènes gènes et et évolution évolution des des familles familles de de gènes gènes • Duplication de gènes: évènement fondamental en évolution moléculaire = source du "bricolage moléculaire" • Types de duplication: – – – – – duplication d'un segment de gène duplication entière d'un gène duplication d'une partie de chromosome duplication entière d'un chromosome duplication d'un génome entier Ö polyploïdie • Cause de duplication: crossing-over inégal évolution des génomes 2. 2. Duplication Duplication de de gènes gènes et et évolution évolution des des familles familles de de gènes gènes • Crossing-over inégal: Ö Processus plus fréquent dans régions présentant des motifs répétés (ex. locus VNTR utilisés dans l'identification de criminels) 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes • Evolution de gènes dupliqués en entier: – conservation de la fonction originale Ö copies invariantes: production en masse de certains ARN et protéines – émergence d'une nouveauté génétique: une copie conserve sa fonction initiale, l'autre acquiert une nouvelle fonction – perte de la fonction originale et dégradation de la séquence (codon stop, perte TATA box, décalage de cadre de lecture, …): évolution en pseudogène 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes • Evolution de gènes dupliqués en entier: – L'ensemble des gènes appartenant à un même groupe de séquences ayant évolué par le processus de duplication = famille de gènes (incluant copies fonctionnelles et non fonctionnelles) – Les membres d'une famille de gènes se trouvent généralement à proximité l'un de l'autre sur le même chromosome, en raison de leur évolution par crossing-over inégal Exemple: les familles de gènes de l'α et de la β-globine chez l'homme pseudogènes 4.1. 4.1. Evolution Evolution de de familles familles de de gènes gènes • A. Conservation de la fonction originale après duplication : – "répétitions de dose" favorisées quand justifié par un besoin métabolique intense pour une molécule donnée: • ARN ribosomaux, ARN de transfert → répétés en tandem • protéines ubiquistes comme les histones (lors de divisions cellulaires) 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes B. Emergence d'une nouveauté génétique après duplication: une copie conserve sa fonction initiale, l'autre diverge et acquiert une nouvelle fonction • Exemple: les protéines opsines des pigments rétiniens responsables de la vision des couleurs – Chez l'homme + singes de l'ancien monde → ∃ 3 opsines différentes: • opsine "bleue" (iodopsine S) située sur le chromosome 7 (=autosome) • opsines "rouge" et "verte" (iodopsine M et L) situées sur le chrom. X Ö vision trichromatique Apparus par 2 évènements de duplication: – 600 Ma: séparation entre iodopsine S et iodopsine "ML" (43% identité séq. a.a.) Ö vision dichromatique après divergence de S et "ML" – 35 Ma: séparation entre iodopsine M et L (96% identité séq. a.a.) Ö vision trichromatique après divergence de M et L 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes • Exemple: les protéines opsines des pigments rétiniens responsables de la vision des couleurs – Homme + singes de l'ancien monde → ∃ 3 opsines ≠ Ö vision trichromatique : • opsine "bleue" (iodopsine S) située sur le chromosome 7 (=autosome) • opsines "rouge" et "verte" (iodopsine M et L) situées sur le chrom. X – Troubles génétiques de vision des couleurs (daltonisme): altération gène M ou L • individus ♀: si 1 seule copie porte allèle délétère (hétéroz.) Ö vision normale • individus ♀: caractère exprimé seulement si homozygote pour allèle délétère • individus ♂: caractère toujours exprimé car une seule copie du chrom. X 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes • Emergence d'une nouvelle fonction après duplication: –Ex.: vision des couleurs liée à coexistence de 3 types de gènes de pigmentation de la rétine, issus de duplication. Copies de gènes →pigments rouges verts bleus 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes • C. Perte de la fonction originale après duplication et dégradation de la séquence: – une des 2 copies conserve la fonction originale, l'autre devient nonfonctionnelle (mutation délétère) Ö évolution en pseudogène (gène A Ö pseudogène noté ΨA) – mécanisme de perte de fonction: codon stop, perte TATA box, décalage de cadre de lecture, perte sites d'épissage,… – forte probabilité d'évolution en pseudogène après duplication (la première des 2 copies qui mute Ö pseudogène; l'autre devient un gène à copie unique) Ö pseudogènes très fréquents (∃ presque toutes familles de gènes) 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes • Datation d'un évènement de duplication: – 2 gènes sont dits paralogues s'ils dérivent d'un évènement de duplication (∈ 2 locus distincts dans même génome: α et β) – 2 gènes sont dits orthologues s'ils dérivent d'un évènement de spéciation (∈ même locus dans 2 génomes distincts: α espèce 1 et α espèce 2) terme "homologue" imprécis! 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes • Datation d'un évènement de duplication: – on veut estimer TD = temps écoulé depuis duplication menant à α et β (2 gènes paralogues) – on connait TS = temps écoulé depuis spéciation menant aux espèces 1 et 2; et les séquences des 2 paires de copies orthologues de α et β 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes • Datation d'un évènement de duplication: – estimation taux substitution moyen: rα = K α /(2TS) avec K α entre 2 espèces; rmoy= (rα + rβ)/2 Ö hypothèse que même taux substitution entre α et β – estimation nombre substitutions entre α et β : K αβ = moyenne 4 combinaisons – calcul final: TD = K αβ /(2rmoy) 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes • Exemple d'évolution d'une famille de gènes : les globines – Composé de 3 sous-familles: myoglobine; α et β–globines 2 protéines : myoglobine (monomérique); hémoglobine (tétramérique: 2α+2β) Ö divergence il y a 600-800 106 années • myoglobine: tissus musculaires • hémoglobine: sang Ö duplication puis différenciation Ö fonction nouvelle 2.1. 2.1. Evolution Evolution de de familles familles de de gènes gènes • Exemple d'évolution d'une famille de gènes : les globines – Composé de 3 sous-familles: myoglobine; α et β–globines 2 copies quasi-identiques Ö sur des chromosomes différents Ö duplication → Présence de pseudogènes sans différenciation chaînes ξ+ε → hémoglobines de l'embryon et du fetus Ö duplication puis différenciation Ö fonction nouvelle 2.2. 2.2. Evolution Evolution concertée concertée de de familles familles de de gènes gènes • Patrons attendus et observés de variation au sein d'une famille de gènes comportant 6 gènes dupliqués en tandem: – observé: au sein d'une même espèce, les membres d'une famille de séquences répétées sont fortement similaires, alors que les membres de la même famille provenant d'espèces apparentées peuvent être fort différents Ö évolution concertée des membres d'une famille de gènes 2.2. 2.2. Evolution Evolution concertée concertée de de familles familles de de gènes gènes • homogénéisation de la variation au sein d'une famille de gènes dupliqués en tandem: – ∃ mécanismes qui copient une nouvelle mutation favorable apparue dans 1 élément répété vers les autres: • conversion génique • crossing-over inégal mutation Æ 1 membre mutation Æ toute famille 2.2. 2.2. Evolution Evolution concertée concertée de de familles familles de de gènes gènes • homogénéisation de la variation au sein d'une famille de gènes dupliqués en tandem: – conversion génique 2.2. 2.2. Evolution Evolution concertée concertée de de familles familles de de gènes gènes • homogénéisation de la variation au sein d'une famille de gènes dupliqués en tandem: – crossing-over inégal: sélection 2.2. 2.2. Evolution Evolution concertée concertée de de familles familles de de gènes gènes • Evolution concertée des gènes Aγ et Gγ chez les grands singes: – duplication date de 55 millions d'années, nettement antérieure à la séparation Homme/Chimpanzé/Gorille – exon 3: montre patron phylogénétique correspondant au temps de divergence – exons 1 et 2: évolution concertée dans chaque lignée2 exon 3 exons 1 et 2 Ö évolution concertée avec intensités ≠ dans ≠ régions du gène (contraintes sélectives ≠) 2.2. 2.2. Evolution Evolution concertée concertée de de familles familles de de gènes gènes • Conséquences évolutives de l'évolution concertée: – propagation de mutations favorables à l'ensemble des membres d'une famille de gènes – retarde la divergence de copies d'un même gène – complique la datation des évènements de duplication de gènes 3. 3. Polymorphisme Polymorphisme nucléotidique nucléotidique 3.1. Polymorphisme nucléotidique intraspécifique 3.2. Polymorphisme nucléotidique transspécifique 3.1. 3.1. Polymorphisme Polymorphisme nucléotidique nucléotidique intraspécifique intraspécifique • Estimation du polymorphisme moléculaire dans un échantillon de n séquences tirées de la même espèce – Estimateur 1: Diversité nucléotidique π π = Nombre moyen de différences nucléotidiques par site entre deux séquences de l'échantillon – Estimateur 2: θw de Watterson θw = S/(L.a) = Nombre de sites polymorphes dans l'échantillon (S) divisé par la longueur de la séquence (L) et par facteur normatif a (a = 1+1/2+1/3+…+1/n-1) ª Modèle neutre, équilibre dérive/mutation : E(π) = E(θw) Estimateur 1 π12 = 5/18 π23 = 3/18 π13 = 3/18 <π> = 0.204 b AGC AGT ACC TAA CAC TAG b AGC TGA ACC TAA AAC TAT b AGC TGT ACC TTA CAC TAT Estimateur 2 L = 18 S=5 a = 1.5 et n = 3 θw = S/(L.a) = 0.185 3.1. 3.1. Polymorphisme Polymorphisme nucléotidique nucléotidique intraspécifique intraspécifique • 11 séquences de l'alcool déshydrogénase chez Drosophile échantillonnées dans l'espèce D. melanogaster: L = 2379 pb. (tiré de Graur & Li, 2000) • variation nucléotidique concentrée au sein des introns • nombre de sites polymorphes = S = 43 • nombre de différences nucléotidiques entre séquences 1-S et 2-S = 3 (π12=3/2379=0.0013) • diversité nucléotidique = moyenne des π ij: π = 0.007 3.1. 3.1. Polymorphisme Polymorphisme nucléotidique nucléotidique intraspécifique intraspécifique Crustacés Balance dérive/mutation π* = 4Nu Insectes Mollusques Amphibiens Echinodermes Reptiles + Oiseaux Homo sapiens : πs = 0.0007 (Altchuler et al. 2001) Poissons Mammifères (Bazin et al., Science 2006) Effet de la taille des organismes Î taille des populations N (dérive génétique) 3.1. 3.1.Polymorphisme Polymorphismenucléotidique nucléotidiqueintraspécifique intraspécifique • Effet d'un goulot d'étranglement associé à la domestication du maïs Forme sauvage (téosinte) Forme sélectionnée lors de la domestication 3.1. 3.1.Polymorphisme Polymorphismenucléotidique nucléotidiqueintraspécifique intraspécifique Effet d'un goulot d'étranglement associé à la domestication du maïs: • comparaison maïs Ù téosinte (ancêtre) – Ì diversité nucléotidique syn. <π> = 0.025 πsyn Téosinte Maïs <π> = 0.015 (Ì40%) 3.1. 3.1.Polymorphisme Polymorphismenucléotidique nucléotidiqueintraspécifique intraspécifique • Effet du système de reproduction – Evolution de l'autogamie (Ê autofécondation) Arabidopsis thaliana Nasrallah et al., 2000, Plant Physiol. 124: 1605 A. lyrata (allogame) 3.1. 3.1.Polymorphisme Polymorphismenucléotidique nucléotidiqueintraspécifique intraspécifique – Evolution de l'autogamie chez A. thaliana Î Ì diversité génétique (div. nucléotidique synonyme πS) 100% autogamie Î 100% homozygotie Î réduction par 2 du nombre de copies de gènes (NeÌ) Î Ê dérive génétique πSyn. A. lyrata A. thaliana adapté de Charlesworth 2003 Phil. Trans. R. Soc. Lond. B 358:1051 • Effet du système de reproduction 3.1. 3.1.Polymorphisme Polymorphismenucléotidique nucléotidiqueintraspécifique intraspécifique • Gène sélectionné au cours du processus de domestication: tb1 Æ dominance apicale chez le maïs Diversité moléculaire dans la region 5' de tb1 chez maïs et téosinte Clark, Richard M. et al. (2004) Proc. Natl. Acad. Sci. USA 101, 700-707 Perte diversité drastique dans la région promotrice de tb1 chez maïs: Î balayage sélectif Déf. Déf.Auto-stop Auto-stopmoléculaire moléculaire • Auto-stop moléculaire: phénomène d'association de variants (allèle, SNP) "neutres" avec les variants d'un locus soumis à sélection – Cause: liaison génétique (dépend du taux de recombinaison entre locus neutre et locus sélectionné) – Conséquences: Ê ou Ì polymorphisme au locus "neutre" par rapport aux locus "témoins" (non liés au locus sélectionné), selon le type de sélection naturelle Liaison Liaisongénétique génétiqueetetdéséquilibre déséquilibrede deliaison liaison • • Principe de Hardy-Weinberg → association aléatoire des allèles d'un même locus Comment s'associent des allèles de locus différents? – Locus A avec 2 allèles A1 (p1) et A2 (p2) – Locus B avec 2 allèles B1 (q1) et B2 (q2) – si association aléatoire Ö 4 types de gamètes: A1B1 (x1); A1B2 (x2); A2B1 (x3); A2B2 (x4) = x1 = x2 = x3 = x4 → locus dits "en équilibre de liaison" (tiré de Hartl, 1994) Liaison Liaisongénétique génétiqueetetdéséquilibre déséquilibrede deliaison liaison • Si association des allèles aux locus A et B ne se fait pas de manière aléatoire au sein des gamètes → locus dits "en déséquilibre de liaison" (sélection, fusion 2 pop., goulet étrangl.) Ö paramètre supplémentaire: déviation D D = param. déséquilibre de liaison = x1-p1q1 • symétrie Ö D = x1.x4-x2.x3 • Si hypothèses du modèle de H-W Ö les fréquences gamétiques tendent vers équilibre de liaison mais la vitesse d'approche peut être lente (><1 locus H-W en 1 seule génération !) Liaison Liaisongénétique génétiqueetetdéséquilibre déséquilibrede deliaison liaison • Vitessse d'approche → équilibre de liaison dépend du taux de recombinaison entre 2 locus • Dn = (1-r)Dn-1 = (1-r)n Do (tiré de Hartl & Clark, 1997) Patron Patron de de déséquilibre déséquilibre de de liaison liaison • Locus ou sites proches le long d'un chromosome Î Ì taux recombinaison Î Ê déséquilibre de liaison Déséq. liaison Nordborg et al. 2002 Nature Genetics, Arabidopsis thaliana Patron Patron de de déséquilibre déséquilibre de de liaison liaison Absence Absence de de sélection: sélection: modèle modèle neutre neutre • Le devenir de nouvelles mutations selon la théorie neutraliste de l'évolution moléculaire (Motoo Kimura) • Interaction entre 2 forces évolutives: le processus de mutation-dérive fréquence mutation Devenir de mutations neutres (synonymes; non codants) 1 extinction de la mutation fixation de la mutation (substitution) 0 Echelle de temps évolutive Absence Absence de de sélection: sélection: modèle modèle neutre neutre Scénario neutre Temps Temps de de fixation fixation par par dérive dérive génétique génétique d'un d'un allèle allèle neutre neutre • Si allèle sélectivement neutre Ö devenir est déterminé par la dérive génétique Ö dépend de N et de sa fréquence actuelle Fréquences alléliques tfix 1 élimination d'un alllèle mutant fixation d'un alllèle mutant 0 Temps •Temps moyen de fixation: t fix ≈ 4 N générations Sélection Sélection directionnelle directionnelle Si allèle non neutre Ö devenir est déterminé par la sélection naturelle si N est grand (sélection > dérive génétique) Ö dépend du coefficient de sélection s: (en générat°) t fix = ( 2 / s ) ln( 2 N ) Fréquences alléliques • fixation d'un alllèle mutant favorable 0 élimination d'un alllèle mutant favorable Temps Exple: mammifère avec N = 106, temps moyen générat° = 2 ans • nouvelle mutation neutre: tfix = 4x106x2 = 8 millions d'années • nouvelle mutation favorable avec s = 1%: tfix = 2/0.01xln(2x106)x2 = 5800 ans Ö Evolution plus rapide sous sélection directionnelle positive! Auto-stop Auto-stop moléculaire moléculaire et et sélection sélection Scénario neutre Balayage sélectif sélection Balayage Balayage sélectif sélectif Effet de l'intensité de la sélection Balayage Balayage sélectif sélectif • Example: tb1 dominance apicale chez le maïs Molecular diversity in the 5' region of tb1 in a sample of 24 individuals Clark, Richard M. et al. (2004) Proc. Natl. Acad. Sci. USA 101, 700-707 Chute de diversité dans la région du promoteur du locus tb1 Î Balayage sélectif Conséquences Conséquences des des balayages balayages sélectifs sélectifs • Phénomène de variation du taux de recombinaison au travers d'un génome Ö conséquences sur le niveau de polymorphisme (tiré de Hartl & Clark, 1997) Relation entre taux de recombinaison et polymorphisme chez la Drosophile 2 hypothèses: • balayage sélectif autour de locus soumis à une sélection directionnelle positive • sélection d'arrière-plan: élimination d'allèles neutres au voisinage de locus soumis à une sélection menant à la purge d'allèles délétères