DEA d’Océanographie Paris 6 Jeudi 6 décembre 2001 La sélection naturelle: son étude par la génétique des populations et son importance comme « force évolutive » Patrice PICCINO Equipe Evolution et Génétique des Populations Marines Station Biologique de Roscoff Plan du cours 1-Introduction 1-1-Apparition du concept de sélection naturelle 1-2-Lien entre Biologie, Biologie évolutive, Génétique des populations et Sélection… 1-3-Notion de valeur sélective 2-Les modèles de bases en Génétique des Populations 2-1-Hypothèses implicites 2-2-Calcul des fréquences alléliques avant et après sélection 2-3-Sélections directionnelle, balancée et disruptive et paramétrisation de la valeur sélective 2-4-Sélection directionnelle (« General dominance ») - « purifying selection » - « progressive selection » 2-5-Sélection balancée par avantage de l’hétérozygote 2-6-Sélection disruptive par avantage des homozygotes P. Piccino 3-Modèles plus complexes 3-1-Influence des paramètres environnementaux (« Ecological genetics ») 3-2-Variation spatiale de ces paramètres: modèle de Levene (1953) 3-3-Autres modèles de sélection 3-4-Test permettant de détecter de la sélection 4-Limites de l’influence de la sélection naturelle 4-1-Niveaux de sélection 4-2-Limites de la sélection 4-3-Evolution moléculaire et sélection 5-Exemples d’études de la sélection naturelle en milieu marin 5-1-Micro-environnements, sélection et calcul de valeur sélective 5-2-Survie différentielle, environnement hétérogène et modèle de Levene 5-3-Comparaison entre marqueurs « neutres » et marqueurs allozymiques: sélection balancée? 5-4-Evolution moléculaire et sélection positive 5-5-Marqueurs allozymiques, différenciation génétique en fonction de l’habitat (température,…) et propriétés biochimiques différentielles d’allozymes en fonction de la température P. Piccino Bibliographie Livres • • Philip W. Hedrick. Genetics of populations. Second Edition. Jones and Bartlett Publishers. 1999 Francine Brondex. Évolution Synthèse des faits et théories. Dunod. 1999 Exemples • • • • Strong natural selection causes microscale allozyme variation in a marine snail Johannesson et al, Proc. Natl. Acad. Sci. USA, 92, 1995, 2602-2606 Adaptative maintenance of genetic polymorphism in an interdital Barnacle: Habitatand Life-stage-specific survivorship of MPI genotypes Paul S. Schmidt and David M. Rand, Evolution, 55(7), 2001, 1336-1384 Balancing Selection at Allozyme loci in Oysters: Implications from Nuclear RFLPs Stephen A. Karl and John C. Avise. Science, 256, 1992, 100-102 Antartic fish hemoglobins: Evidence for adaptative evolution at subzero temperature Barcelloni, L., Marcato, S. and Patarnello, T., Proc. Natl. Acad. Sci. USA, 95, 1998, 8670-8675 P. Piccino 1-Introduction Apparition du concept de sélection naturelle (1) • On peut trouver des précurseurs à la théorie de l’Évolution jusqu’à Aristote, mais avant le 18ème siècle, la pensée qui domine est le fixisme. • Au 18ème siècle, avec le développement de la Paléontologie (fossiles), de l’Anatomie comparée (unité de plan d’organisation), de l’Embryologie (ressemblances entre différentes espèces) et l’hypothèse que la Terre a plus de 2000 ans, l’idée d’Évolution commence à germer • Différentes théories émergent à la lueur des résultats obtenus dans ces différentes disciplines : - Transformisme (Lamarck) - Catastrophisme (Cuvier) - Uniformitarisme (Lyell) - Idéalisme (Meckel, Von Baer) • Mais l’actuelle conception de l’Évolution biologique naît avec Charles Darwin (1809-1882) (Peter T Bowler Evolution: the history of an idea) P. Piccino Apparition du concept de sélection naturelle (2) Charles Darwin • Voyage autour du monde sur le Beagle • Escale aux Galapagos: les pinsons (1835) P. Piccino Apparition du concept de sélection naturelle (3) Livre fondateur de la théorie de la descendance avec modification par voie de sélection naturelle: “On the Origin of Species by Means of Natural Selection or the Preservation of Favoured Races in the Struggle for Life” (1859). Charles Darwin « Définition »: - Différences (phénotypiques) entre les individus d’une même population - Certaines de ces différences sont héritables - Descendance avec modification: si ces différences héritables induisent des différences dans les paramètres individuels de survie et/ou de reproduction, les variants qui ont une meilleur survie et/ou reproduction dans un environnement donné vont se répandre dans la population. La “force” en jeu est la sélection naturelle P. Piccino Apparition du concept de sélection naturelle (4) Schématisation: Précisions: - Darwin ne connaissait pas les lois de Mendel - Il ne considérait pas que la sélection naturelle était la seule force évolutive P. Piccino Lien entre Biologie, Biologie évolutive, Génétique des populations et Sélection… • “Nothing in biology makes sense except in the light of evolution” (Dobzhansky, 1973) • La Sélection naturelle est une des principales “forces” de l’Évolution • La Génétique des populations est une discipline d’étude des fréquences alléliques et génotypiques, des mécanismes micro évolutifs à la base de la variabilité de ces fréquences et des implications biologiques (notamment évolutive) de cette variabilité (ou de l’absence de variabilité) • On distingue 4 grandes forces évolutives: - mutation - migration - dérive - sélection P. Piccino P. Piccino La sélection: notion de valeur sélective Représentation schématique des relations entre variations génotypiques, environnementales, phénotypiques et valeur sélective Variation génotypique + Variation environnementale Variation phénotypique Fitness = « lifetime reproductive success » = paramètres de fécondité et de reproduction * paramètres de survie = taux asymptotique d’accroissement de la population = reproduction de ses gènes * survie de ses gènes Les composantes de la fitness: Bundgaard, J. and F.B. Christiansen. 1972. Genetics 71: 439-460 Valeur sélective (fitness) 2-Les modèles de base en Génétique des Populations Les modèles de base en génétique des populations Les hypothèses implicites: • Système génétique - un locus, autosomal et biallélique - diploïdie - reproduction sexuée, panmixie • Caractéristiques de la sélection - identique pour les deux sexes - la seule composante de la fitness affectée est la viabilité - la fitness est constante pour chaque génotype au cours du temps et dans l’espace • Autres facteurs - générations non chevauchantes - population de taille infinie - pas de flux de gènes - pas de mutation P. Piccino Adultes A1A1 A1A2 A2A2 1) f(A1)=p0 f(A2)=q0 Méïose 2) f(A1)=p0 f(A2)=q0 2 4) f(A1A 1) = p0 w 11 w f(A1A 2 ) = 2p0q0 w 12 w f(A2 A 2 ) = q20 w 22 w f(A1) = p1 f(A2 ) = q1 Gamètes A1 A2 Survie différentielle (sélection) 5) f(A1)=p1 f(A2)=q1 Juvéniles A1A1 A1A2 A2A2 Fécondation (panmixie) 3) f(A1A1)=f(A1)*f(A1)=p02 f(A1A2)=2*f(A1)*f(A2)=2p0q0 f(A2A2)=f(A2)*f(A2)=q02 f(A1)=p0 f(A2)=q0 P. Piccino Evolution des fréquences génotypiques et alléliques Valeur sélective relative moyenne de la population: w = p20w11 + 2p0q0w12 + q02w22 Evolution des fréquences alléliques: 2 2 q1 = 1 2p0q0w12 + q0 w22 = p0q0w12 + q0w 22 2 w w w ∆q = q1 − q0 = p0q0[q0( w 22 − w12 ) − p0( w11 − w12 )] w P. Piccino Sélections directionnelle, balancée et disruptive Sélection directionnelle (= dirigée) pour l’allèle A1 ou l’allèle A2 ⇒ fixation d’un allèle (1, 2, 3) Sélection balancée par avantage de l’hétérozygote (= superdominance) ⇒ équilibre stable ⇒ maintien du polymorphisme (4) Sélection divergente (= disruptive) par avantage des deux homozygotes (= sousdominance) ⇒ équilibre instable (5) P. Piccino Paramétrisation de la valeur sélective et modes de sélection associés Sélection directionnelle Sélection balancée Sélection disruptive s = coefficient de sélection (négative) contre les homozygotes h = niveau de dominance (il peut varier au cours du temps en fonction du background génétique ou de l’environnement; D. Bourguet. The evolution of dominance. Heredity 83 (1999) 1-4) P. Piccino Sélection directionnelle: « general dominance » « Purifying selection » A1A1 Génotype A1A2 A2A2 Fitness w11 w12 w22 Fitness 1 1-hs 1-s Fréquences avant sélection p20 p02 w Fréquences après sélection 2p0q0 q20 2p0q0(1 − hs) q02(1 − s) w w w = p20w11 + 2p0q0w12 + q02w22 w = p20 + 2p0q0(1 − hs) + q20(1 − s) La fitness moyenne est maximale quand A1 est fixé ∆q = q1 − q0 = p0q0[q0( w 22 − w12 ) − p0( w11 − w12 )] w ∆q = q1 − q0 = − sp0q0[h −wq0(2h − 1)] dq ∆q = dt qt dq t = ∫q 0 ∆q P. Piccino « Purifying selection » Sélection directionnelle Sélection balancée Sélection disruptive w = p20 + 2p0q0(1 − hs) + q20(1 − s) ∆q = q1 − q0 = − sp0q0[h −wq0(2h − 1)] Recessive: h = 0 Additive: h = 0,5 Dominant: h = 1 P. Piccino Sélection directionnelle: « general dominance » « Progressive selection » A1A1 1+ hs w 22 1 p20 p20(1 + s) w 2p0q0 2p0q0(1 + hs) w q20 q20 w Fitness Fréquences après sélection w = p20(1 + s ) + 2p0q0(1 + hs) + q 20 ∆q = q1 − q0 = − sp0q0[h +wp0(1 − 2h )] Recessive: h = 0 Additive: h = 0,5 Dominant: h = 1 P. Piccino w12 A2A2 w11 1+ s Fitness Fréquences avant sélection Génotype A1A2 Sélection balancée par avantage de l’hétérozygote A1A1 Génotype A1A2 A2A2 w11 1-s1 w12 1 w 22 1-s2 p20 p02(1 − s1) w 2p0q0 2p0q0 w q20 q02(1 − s2) w Fitness Fitness Fréquences avant sélection Fréquences après sélection w = p20(1 − s1) + 2p0q0 + q20(1 − s2) w = 1 − p02s1 − q 20s2 ∆q = p0q0(s1p0 − s2q0) w ∆q = 0 ⇔ q = 0 ou p = 0 ou s1p0 − s2q0 = 0 qe = s1 s1 +s2 P. Piccino Sélection disruptive par avantage des homozygotes Fitness Fitness Fréquences avant sélection Fréquences après sélection A1A1 Génotype A1A2 w11 1+s1 w12 1 p20 p02(1 + s1) w w = p20(1 + s1) + 2p0q0 + q20(1 + s2) w = 1 + p02s1 + q 20s2 ∆q = p0q0(s2q0 − s1p0) w ∆q = 0 ⇔ q = 0 ou p = 0 ou s2q0 − s1p0 = 0 qe = s1 s1 +s2 P. Piccino 2p0q0 2p0q0 w A2A2 w 22 1+s2 q20 q02(1 + s2) w 3-Modèles plus complexes Influence des paramètres environnementaux (« Ecological genetics ») • Les modèles de base: environnement constant et homogène • Paramètres environnementaux: - physico-chimiques: température, salinité, oxygène, substrat… - biotiques: densité, compétiteurs, prédateurs, proies, parasites,... • A l’échelle d’une population: micro environnements A l’échelle d’une métapopulation ou d’une espèce: diversité des environnements • Variation temporelle des paramètres environnementaux Modèles plus complexes intégrant variabilité spatiale et temporelle de l’environnement P. Piccino Variation spatiale: modèle de Levene (1953) Niche i A1A1 Génotype A1A2 A2A2 w11.i 1 w 22.i Fréquences avant sélection p20 2p0q0 q 20 Fréquences après sélection p02w11.i w 2p0q0 w q02w 22.i w Fitness ∆qi = ∆q = p0q0[p0(1 − w11.i ) − q 0(1 −w 22.i )] w i=m ∑ ci∆qi i =1 = i=m p0(1 − w11.i) − q0(1 − w 22.i) ∆q = p0q0 ∑ ci wi i =1 P. Piccino Variation spatiale: modèle de Levene (1953) i=m p(1 − w11.i) − q(1 − w 22.i) ∆q = pq ∑ ci wi i =1 h(q) = h(q) = ∆q pq i=m p(1 − w11.i) − q(1 − w22.i) wi ∑ ci i =1 = H(q) est continue entre 0 et 1 donc si h(0) est positif et h(1) négatif il y a au moins une valeur de q pour laquelle on a un équilibre stable où le polymorphisme est maintenu. Ces conditions sont réunies si: 1 − w11.i 1 h(0) = ∑ ci > 0 ⇔ <1 c w i i =1 i ∑ w11.i i=m et w − 1 1 <1 h(1) = ∑ ci 22.i < 0 ⇔ ci wi i =1 ∑ w22.i i= m La moyenne arithmétique de la fitness de A1A1 sur toutes les niches est inférieure à 1 (moyenne arithmétique de la fitness de l’hétérozygote) La moyenne arithmétique de la fitness de A2A2 sur toutes les niches est inférieure à 1 ⇒ « marginal heterozygote advantage » P. Piccino Variation spatiale: modèle de Levene (1953) Il peut cependant y avoir maintien du polymorphisme même si l’hétérozygote et un des homozygotes ont la même fitness dans tous les environnements ⇒ « absolute or complete dominance model » (Prout, 1968) Niche i A1A1 Fitness Fréquences avant sélection Fréquences après sélection Génotype A1A2 A2A2 1 1 w 22.i p20 p02 w 2p0q0 q20 2p0q0 w q02w 22.i w Condition pour qu’il y ait maintien du polymorphisme: 1 < 1 < ∑ ci w22.i c i ∑ w 22.i P. Piccino C1=C2=0,5 Variation spatiale: modèle de Levene (1953) « Habitat selection » (Hedrick, 1990) P. Piccino Autres modèles de sélection • • • • • Modèles multialléliques (Lewontin et al, 1978) Modèles multigènes (« adaptative topography », Wright, 1969) Modèles de sélection de traits quantitatifs (génétique quantitative) Modèles haplodiploïdes (Hedrick et Parker, 1997) Modèles prenant en compte la variation temporelle de l’environnement (Haldane et Jayakar, 1963; Gillespie, 1971; Ellner et Hairston, 1994; Hedrick, 1995) • Modèles de sélection fréquence dépendante (ex: avantage du male rare) (Review: Clarke et al., 1988; Hori, 1993) • Modèles intégrant les autres forces évolutives (mutation, dérive, migration) (ex: modèle en île et sélection, Hedrick, 1999) P. Piccino Tests permettant de détecter la sélection • La sélection comme les autres forces évolutives influence la différenciation génétique intra et inter-population Tests basés sur les propriétés des F-statistiques et de leurs estimateurs: -Lewontin and Krakauer (1973), test basé sur la variance inter-locus du Fst -Beaumont et Nichols (1996), test basé sur la relation entre Fst et Hexp -Raufaste et Bonhomme (soumis), test basé sur la comparaison des estimateurs de Weir et Cockeram et de Robertson et Hill du Fst -tests de neutralité sélective, basés sur la comparaison entre estimateurs du Fst (séquences ADN) ou sur l’adéquation des données avec le modèle neutraliste de l’évolution moléculaire évaluée par la méthode du maximum de vraisemblance P. Piccino 4-Limites de l’influence de la sélection naturelle Les niveaux de sélection • La sélection porte sur la survie et la reproduction des individus: les variants génétiques qui survivent ou se reproduisent mieux dans un environnement donné sont sélectionnés et se répandent dans la population. Au niveau moléculaire, les combinaisons alléliques qui confèrent les meilleurs paramètres de survie et de reproduction aux individus qui les portent se répandent dans la population (ce qui est sélectionné c’est le phénotype et non le génotype). • Sélection de groupe? Sélection de parentèle Sélection de parentèle (« kin selection », Hamilton, 1964): un comportement qui favorise la survie et/ou la reproduction d’apparentés peut aussi être sélectionné (eusocialité: hyménoptères, termites, rats-taupes...). Notion d ’« inclusive fitness » = valeur sélective mesurée non plus par la descendance de l’individu mais aussi par celle de ses apparentés. Sélection de groupe: ex des comportements altruistes (cri d’alarme de la marmotte) P. Piccino Les limites de la sélection • • • • Optimisation: pics et vallées adaptatives (Wright). Maximums locaux Notion de trade-off Contraintes phylogénétiques, développementales, allométriques... Interactions entre individus: stratégies évolutivement stables (ESS, Maynard Smith) • Interactions entre espèces: coévolution P. Piccino Evolution moléculaire et sélection • Horloge moléculaire (ex: chaîne α de l’hémoglobine des Vertébrés). Le taux d’évolution (nombre de substitutions en acides aminés/molécule/année) est dans ce cas constant quelle que soit la lignée. • Important polymorphisme moléculaire mis en évidence par les techniques d’électrophorèse qui n’a pas toujours d’effet sur le phénotype (mutations synonymes) Théorie neutraliste de l ’évolution moléculaire (Motoo Kimura) Précisions: Kimura ne remet pas en cause l’effet de la sélection naturelle au niveau phénotypique mais il minimise son importance dans les processus d’évolution moléculaire. P. Piccino Evolution moléculaire et sélection • Mécanismes moléculaires de sélection: lien entre la séquence nucléotidique d’un variant et la valeur sélective de l’individu • Les modèles multilocus: Balayage sélectif (« selective sweep »), autostop (« Hitchhiking »), « genetic background » Nouveaux moyens d’investigations en génétique des populations • La théorie de la coalescence (Kingman, 1982) et l’étude de la généalogie des gènes dans une population: mise en évidence de balayages sélectifs… • Les tests de neutralité sélective et la mise en évidence de la sélection par comparaison avec les attendus du modèle neutraliste de l’évolution moléculaire P. Piccino 5-Exemples d’études de la sélection naturelle en milieu marin Micro-environnement, sélection et calcul de valeur sélective Strong natural selection causes microscale allozyme variation in a marine snail Johannesson et al, Proc. Natl. Acad. Sci. USA, 92, 1995, 2602-2606 Allèle 120 Allèle 120 Mai 1988: Bloom d’un microflagellé produisant une toxine ⇒ mort de toutes les littorines de la « surf zone » (Upper Low A, Low A, Low B) ∆q = Génotype Fitness Fréquences avant sélection Fréquences après sélection 120/120 wI 2 0 p p02wI w 120/100 1 2p0q0 2p0q0 w 100/100 w III q 20 q20w III w p0q0[q0( w III − 1) − p0( w I − 1)] p20w I + 2p0q0 + q20w III ( ) ( ) w III = u 0 u0 w I + u0 − u0 u1 u1 u0 = p0 q0 Survie différentielle, Environnement hétérogène et modèle de Levene Adaptative maintenance of genetic polymorphism in an interdital Barnacle: Habitat- and Life-stage-specific survivorship of MPI genotypes Paul S. Schmidt and David M. Rand, Evolution, 55(7), 2001, 1336-1384 Exposés Protégés par A. nodosum Comparaison entre marqueurs « neutres » et marqueurs allozymiques: sélection balancée? Balancing Selection at Allozyme loci in Oysters: Implications from Nuclear RFLPs Stephen A. Karl and John C. Avise. Science, 256, 1992, p100-102 Evolution moléculaire et sélection positive Antartic fish hemoglobins: Evidence for adaptative evolution at subzero temperature Barcelloni, L., Marcato, S. and Patarnello, T., Proc. Natl. Acad. Sci. USA, 95, 1998, p8670-8675 Séquences nucléotidiques: mutations synonymes (=silencieuses) et non synonymes(=de remplacement): Gène codant pour une protéine X, séquence de l’ARNm et de la protéine: Espèce A: …CUU CAU CAG… … Leu His Gln … Espèce B: …AUU CAC CAG… … Ile His Gln … Mutation synonyme Mutation non synonyme Ka/Ks (Ka=taux de mutations non synonymes; Ks=taux de mutations synonymes): Ka/Ks <1: selection « négative », mutations non synonymes délétères Ka/Ks >1: selection « positive », mutations non synonymes adaptatives (diversification fonctionnelle,…) Naked dragonfish Gymnodraco acuticeps Striped notothen or rockcod / green rockcod Trematomus hansoni Emerald notothen or rockcod Trematomus bernacchii Marqueurs allozymiques, différenciation génétique en fonction de l’habitat (température,…) et propriétés biochimiques différentielles d’allozymes en fonction de la température Thermal adaptation of Alvinella pompejana (Polychaeta : Alvinellidae) in a highly fluctuating environment : a case study of phosphoglucomutase PGM-1 P. PICCINO*, D. JOLLIVET* and F. VIARD*, 2ème Congrès International sur les Sources Hydrothermales, Brest, Octobre 2001 RESUME Alvinella pompejana vit au sommet des cheminées hydrothermales situées sur la dorsale Est-Pacifique (EPR), un biotope aux températures extrêmes et hautement variables. On pense qu’il est l'un des métazoaires les plus thermotolérants et eurythermes sur notre planète, ce qui en fait un excellent modèle pour l’étude des adaptations à la température au niveau populationnel. L’étude détaillée ici utilise des méthodes de biochimie et de génétique des populations pour estimer l'effet de la sélection sur les variants de la phosphoglucomutase (PGM), une enzyme relais entre le métabolisme du glycogène et la glycolyse, c’est à dire une enzyme clef du métabolisme énergétique. Après électrophorèse sur gel d’amidon, le locus PGM-1 d’A. pompejana est composé de 4 allozymes, les allozymes 90 et 100 étant majoritaires avec des fréquences autour de 50%. De plus l’allozyme 90 apparaît plus thermostable que l’allozyme 100. Cette étude montre une différenciation génétique significative au locus PGM-1 entre populations d’habitats thermiquement contrastés et une corrélation significative entre la température de l’habitat des Alvinelles et la fréquence de l’allozyme 90. Les expériences d’enzymologie confirment la meilleure adaptation de l’allozyme 90 aux températures élevées. Ces résultats suggèrent que les fréquences allozymiques au locus PGM-1 sont contrôlées au moins partiellement par la température et qu ’il s’opère une sélection dirigée pour l ’allozyme 90 dans les habitats caractérisés par une forte température. Mots-clés : sites hydrothermaux, phosphoglucomutase, allozymes, température, sélection dirigée P. Piccino