BOP Génétique des populations Xavier Vekemans Laboratoire de Génétique et Evolution des Populations Végétales (UMR CNRS 8016), Bureau 203, Bâtiment SN2 e-mail: [email protected] http://www.univ-lille1.fr/gepv lien "Ressources pédagogiques" Supports de cours élaborés par Xavier Vekemans et Joël Cuguen (UMR 8016) Ouvrages g de référence • Henry, y, JP et PH Gouyon y 1998 Précis de Génétique q des Populations, Masson • Serre, JL 1997 Génétique des Populations, Nathan • Hartl, DL 1994 Génétique des Populations, Flammarion • Solignac S li ett coll. ll , 1995 Gé Génétique éti ett E Evolution, l ti T Tomes I ett II, Hermann • Ridley, M 1997 Evolution Biologique, De Boeck y PH et coll. 1997 Les Avatars du Gène, Belin • Gouyon • Provine W. 2001 The origins of theoretical population genetics. University of Chicago Press, Chicago: un excellent exposé de l'histoire de la génétique des populations Elé Eléments t de d génétique é éti des d populations l ti 1. Introduction 2 Organisation de la diversité génétique: Principe de Hardy2. Hardy Weinberg 3 Organisation 3. O i i de d la l diversité di i é génétique: é éi A li i du Application d principe de Hardy-Weinberg et écarts à la panmixie 4. Mécanismes évolutifs: Les sources de la variation 5 Mécanismes évolutifs: La sélection naturelle 5. 6. Mécanismes évolutifs: La dérive génétique 1. Introduction 1.1.Qu'est-ce que la génétique des populations? 1 2 Méthodes de détection de la diversité génétique 1.2. 1.3. Polymorphisme génétique 1.1. Qu'est-ce q que la génétique g q des ppopulations? p Définit° Génétique: discipline qui étudie la transmission de l'information héréditaire et son utilisation dans le développement pp et le fonctionnement des organismes – Comment et pourquoi l'information génétique évolue t'elle au cours du temps au sein des espèces et des populations? Æ Génétique des populations 1.1. Q Qu'est-ce q que la génétique g q des ppopulations? p Historiquement une synthèse entre 1. Application des lois de la génétique de la transmission G. Mendel Ö caractères à déterminisme simple 2. Application de la théorie de l'évolution et d la de l sélection él ti naturelle: t ll – Évolution biologique – Évolution par sélection des individus les plus adaptés Ö caractères à distribution continue (quantitatifs: nombre graines, vigueur mâles ) Charles Darwin 1 1 Qu 1.1. Qu'est est-ce ce que la génétique des populations? L fondements Les f d t de d la l génétique é éti des d populations: l ti ∃ diversité di ité génétique é éti • Information ggénétique q → locus → p plusieurs états alléliques q distincts • Diversité génétique s'exprime par les fréquences (proportions) relatives des différents allèles • Evolution agit sur des populations d'individus (groupe d'individus susceptibles de se reproduire entre eux à court terme) • Evolution se traduit par une variation des fréquences alléliques dans les populations au cours du temps • Forces évolutives: pprocessus qqui agissent g sur les changements g de fréquences q alléliques 1.1. Q Qu'est-ce q que la génétique g q des ppopulations? p Forces évolutives: • • • • mutation migration sélection é i naturelle dérive génétique: processus évolutif de fluctuations aléatoires des fréquences alléliques q résultant d'un échantillonnage g aléatoire p parmi les g gamètes – processus important dans les petites populations – force évolutive car changement des fréquences alléliques 1.1. Qu'est-ce que la génétique des populations? Théorie synthétique de l'évolution:1920-1930 • Ronald Fisher: – Héritabilité des caractères quantitatifs → compatibilité avec génétique Mendélienne – Grande population: N inexorable de fréquence des allèles favorisés par sélection naturelle • J.B.S. Haldane: – Approche récursive: variation d'une génération à l'autre des fréquences alléliques sous l'effet de différentes formes de sélection • Sewall Wright: – Effets stochastiques dans petites populations Ö nouvelles combinaisons de gènes Öaction de sélection naturelle – Structuration i de d la l diversité di i génétique i et consanguinité 1.1. Qu'est-ce que la génétique des populations? Objectifs →génétique des populations: (1) Mesurer la diversité génétique dans populations naturelles + décrire patron d'organisation de diversité di ersité (drongo, Dicrurus paradiseus, Mayr & Vaurie Vaurie, 1948) (2) Expliquer E li origine, i i maintien i i et évolution é l i de d la l diversité di i é génétique é éi par l'effet l' ff des forces évolutives • J. Gillespie: "Grande Obsession des généticiens des populations: Quelle force évolutive est responsable du patron observé?" 1.1. Qu'est-ce que la génétique des populations? Objectif 1: Mesurer diversité génétique exple: Estimation des fréquences alléliques Polymorphisme floral chez les Gueules-de-loup Gueules de loup (Antirrhinum majus) Corolle rouge: ro ge: RR Corolle blanche: rr Corolle rose: Rr • • • Echantillon de 400 plantes dd‘une une population: Rouges, n=165; Roses, n=190; Blanches, n=45 P = fréquence de l'allèle R dans l’échantillon = (2x165+190)/800 = 0,65 Q = fréquence de l’allèle r dans l’échantillon = (190+2x45)/800 = 0,35 0 35 Vérification: P+Q = 0,65 + 0,35 = 1,00 1.1. Qu'est-ce que la génétique des populations? Objectif 1: Mesurer diversité génétique Distinction entre paramètre et estimateur • • Les modèles de génétique des populations décrivent l’évolution de quantités décrivant la population dans son entièreté entièreté, quantités appelées paramètres Les études empiriques mènent au calcul de quantités mesurées sur des échantillons sensés représenter la population, quantités appelées estimateurs Exemple des Gueules-de-loup: p = fréquence fé de d l’allèle l’ llèl R dans d la l population l ti = paramètre èt (valeur ( l inconnue) i ) <p> = estimateur de p = fréquence de l’allèle R dans l’échantillon =P = 0,65 1.1. Qu'est-ce que la génétique des populations? Objectif 2: Expliquer patron de diversité génétique exple: Anémie à cellules falciformes chez l’homme (drépanocytose) individu SS individu AA ou AS (tiré de Griffiths et al. 2001) Anomalie génétique quasi-létale à l'état homozygote Variant génétique de la chaîne β−hémoglobine à expression récessive: – allèle llèl normal→A; l A – allèle muté→S; – individus atteints→génotype SS. SS Microgrraphie éle ectroniqu ue de glob bules roug ges • • 1.1. Qu'est-ce que la génétique des populations? Objectif 2: Expliquer patron de diversité génétique exple: p Anémie à cellules falciformes Répartition des fréquences de l'allèle S >0,14 (tiré de e Ridley, 1997) • <0,02 Özones de forte fréquence de S correspondent avec les régions d'endémisme de la malaria 1.1. Qu'est-ce que la génétique des populations? Objectif 2: Expliquer patron de diversité génétique exemple: Anémie à cellules falciformes Anopheles: vecteur du Plasmodium • Explication: Les individus hétérozygotes AS résistent mieux à la malaria (parasite des globules rouges: Plasmodium falciparum) que les homozygotes AA Ö équilibre entre – sélection en faveur de l'hétérozyg. AS Ö N fréq(S) – sélection contre l'homozyg. létal SS Ö P fréq(S) 1.1. Qu'est-ce que la génétique des populations? • Difficultés conceptuelles de la génétique des populations – Discipline essentiellement quantitative: quantification de la diversité génétique; modélisation de l'effet d'une force évolutive sur les fréquences alléliques – Changements évolutifs graduels : • Echelle de temps évolutive: les modifications des fréquences alléliques se marquent → échelle 10.000-106 générat° • Avantages adaptatifs souvent très faibles: difficile à mettre en évidence – Paradoxe: • Evolution agit → phénotypes à déterminisme génétique complexe • Modèles théoriques → évolution de caractères à déterminisme simple 1.2. Méthodes de détection de la diversité génétique • Jusque dans les années 1960: marqueurs phénotypiques (drosophile, couleur fleurs,…) ou sérologiques (ABO, rhésus,…) • Années 1960: découverte des allozymes (tiré de Hartl, 1994) – séparation électrophorétique des protéines – coloration histochimique des enzymes 1.2. Méthodes de détection de la diversité génétique Allozymes Gel obtenu après coloration histochimique (tiré de Hedrick, 2000; Lap= Leucine amino-peptidase; 2 locus distincts Lap-1 et Lap-2) • • Allozymes: formes moléculaires distinctes d’un enzyme chez un même organisme et ayant la même activité catalytique origine des allozymes: mutations Ö changement d’acide aminé qui affecte la charge totale de la protéine sans affecter le site catalytique (± neutre) 1.2. Méthodes de détection de la diversité génétique Allozymes: Relation phénotype Ù génotype codominance + f→"fast" s→"slow" f f x s − Génotype FF x Phé t Phénotype f • • • • SS s Phénotype = nombre/position Phé b / i i relative l i des d bandes b d Isoenzymes ≡ codés par des locus différents (Lap-1 et Lap-2) Allozymes ≡ différents allèles au même locus (F et S) Enzyme monocaténaire: 1 bande = un allèle s FS fs 1.2. Méthodes de détection de la diversité génétique Allozymes: Calcul des fréquences alléliques • • • Echantillon de 9 individus (18 copies d'allèles) – génotypes FF: 3 – génotypes FS: 4 – g génotypes yp SS: 2 Fréquence de l'allèle F: <p> = (3x2+4)/18 = 0,56 Fréquence de l'allèle S: <q> = (4+2x2)/18 = 0,44 1.2. Méthodes de détection de la diversité génétique • Années 70: outils moléculaires → ADN – Utilisation des enzymes de restriction Fréq. moy. coupure 1/256 p.b. (=1/44) 1/4096 p.b. (=1/4 ( 1/46) 1.2. Méthodes de détection de la diversité génétique • Années 70: outils moléculaires → ADN (tiré de Ha artl, 1994) – clivage de l'ADN par enzymes de restriction – procédure éd "Southern "S th Bl Blot" t" – hybridation avec sonde (ADN) radioactive Ö Marqueurs RFLP (("Restriction Restriction fragment length polymorphism polymorphism" = polymorphisme de longueur des fragments de restriction) 1.2. Méthodes de détection de la diversité génétique Marqueurs RFLP • Relation R l i phénotype hé Ù génotype é sites de restriction + X X X sonde-ADN sonde ADN X X X X _ ce fragment f t ne s'hybride 'h b id pas à sonde – Sonde-ADN S d ADN: fragment f t d'ADN marquéé ((radioactif/fluorescent) di tif/fl t) simple-brin i l b i correspondant à une séquence non répétée du génome (gène connu, ou anonyme) – Polymorphisme de présence/absence d'un site de restriction (mutation du site de reconnaissance) Î polymorphisme du nombre et taille des bandes observée – Plusieurs marqueurs Ö différentes combinaisons enzyme/sonde 1.2. Méthodes de détection de la diversité génétique Relation phénotype Ù génotype (tiré d de Hartl, 1994) Marqueurs RFLP → marqueurs co-dominants • Utilisés pour les 1ère cartes génétiques fines • Utilisés pour "DNA-fingerprinting": identification de criminels,… • Utilisés pour reconstructions phylogénétiques, estimation de diversité génétique 1.2. Méthodes de détection de la diversité génétique • Années 80-…: amplification PCR à partir d'ADN ou d'ARN d ARN (→ cDNA) – Marqueurs microsatellites (locus dont séquence = répétition d'un motif simple) p ) – Marqueurs AFLP ("Amplified Fragment Length Polymorphism") – Séquençage dd'ADN ADN Æ SNPs ("Single ( Single Nucleotide Polymorphism Polymorphism")) 1.3. Polymorphisme génétique • Marqueurs génétiques (allozymes, RFLP) Ö quantification du polymorphisme génétique (= diversité génétique) • Déf.: un locus est dit polymorphe dans une population si fréquence de ll'allèle allèle le + commun < 0,95 0 95 (ou 0,99); 0 99); sinon le locus est dit monomorphe Ö exclusion des allèles rares ((fréq. q < 0,005)) souvent délétères et voués à disparaître • Quantification du polymorphisme: – <P> = proportion de locus polymorphes dans un échantillon – <Ho> = hétérozygotie moyenne observée = estimation de la proportion de locus présents à ll'état état dd'hétérozygote hétérozygote chez un individu moyen Æ calculé comme moyenne sur les locus de la proportion de génotypes hétérozygotes dans l'échantillon 1.3. Polymorphisme génétique Polymorphisme des allozymes Synthèse de Nevo (1978) (tiré é de Harttl, 1994) sur 243 espèces Ö important polymorphisme des allozymes • polymorphisme neutre? • surprise pour les "sélectionnistes" (sélect° naturelle censée éliminer variation) 1.3. Polymorphisme génétique Polymorphisme des allozymes • Effet de la "forme de vie" chez les pplantes: étude comparée p du polymorphisme des allozymes chez 473 espèces végétales (Hamrick & Godt, 1989, in Plant population genetics, breeding, and genetic resources, Brown et al. ed., Sinauer, Sunderland) Forme de vie Nombre d'espèces P Ho Annuelle 187 30,2% ± 1,9% 0,105 ± 0,008 Pérenne herbacée 159 28,0% ± 1,8% 0,096 ± 0,008 Pérenne ligneuse 115 50,0% ± 2,5% 0,149 ± 0,009 Ö arbres = espèces végétales les plus variables génétiquement 1.3. Polymorphisme génétique Polymorphisme des allozymes • Polymorphisme P l hi fréquent fé mais i pas universel: i l exemple du guépard Acinonynx jubatus ("cheetah") - O'Brien et al. 1987 PNAS 84:508-511 – Echantillon de 98 individus typés pour 49 allozymes Ö <P> = 0,02 et <Ho> = 0,0004 g historique q ((10.000 B.P.)) Ö ggoulot d'étranglement Ö perdu diversité génétique Ö pperte de sa capacité p évolutive? Elé Eléments t de d génétique é éti des d populations l ti 1. Introduction 2 Organisation de la variation génétique: Principe de Hardy2. Hardy Weinberg 3 Organisation 3. O i i de d la l variation i i génétique: é éi Application A li i du d principe de Hardy-Weinberg et écarts à la panmixie 1.1. Qu'est-ce que la génétique des populations? Objectifs →génétique des populations: (1) Mesurer la variation génétique dans populations naturelles + décrire patron d'organisation de variation (Frêne, Fraxinus excelsior, Marqueurs microsatellites, Heuertz et al. 2004) (2) Expliquer origine, maintien et évolution de la variation ggénétique q ppar l'effet des forces évolutives 2 Organisation de la variation génétique: 2. Principe p de Hardy-Weinberg y g 2.1. Modèle de p population p "idéalisée" 2.2. Principe de Hardy-Weinberg 2.1. Modèle de population "idéalisée" • déf. Population : groupe d'individus de la même espèce vivant dans une aire géographique suffisamment restreinte pour permettre potentiellement à tout membre de se reproduire avec tout autre membre du groupe: unité de reproduction • Exemples: – Les éléphants dd'un un parc national africain – Les chênes d'un massif forestier (pollen à large dispersion anémogame) – Les individus d'une espèce de parasite intestinal, présents chez un seul individu hôte • Synonymes: population locale, dème, sous-population (→ "population" = espèce) 2.1. Modèle de ppopulation p "idéalisée" • Hypothèses du modèle de population de Hardy-Weinberg – organisme diploïde – reproduction sexuée – générations non chevauchantes 2.1. Modèle de population "idéalisée" • Hypothèse de générations non chevauchantes (discrètes): (tiré dee Hartl, 19994) – cycle y de reproduction p simple: p individus de chaque q génération g meurent avant la naissance des membres génération suivante – exemple: plante annuelle (blé, plantes adventices, …); insectes; … – approximation souvent satisfaisante même pour des espèces à cycle reproductif + complexe (Homme: évitement consanguinité, consanguinité temps de génération moyen comme unité de temps) 2.1. Modèle de ppopulation p "idéalisée" • Hypothèses du modèle de population de Hardy-Weinberg – – – – – – organisme diploïde reproduction sexuée générations non chevauchantes locus considéré possède 2 allèles fréquences alléliques identiques chez les individus mâles et femelles panmixie p/r locus considéré 2.1. Modèle de population "idéalisée" • Hypothèse de panmixie: – llors de d la l reproduction, d i les l croisements i s'effectuent ' ff au hasard h d pour les génotypes considérés – double hypothèse: yp 1. les couples reproducteurs s'unissent au hasard (panmixie sensu stricto) 2. les gamètes produits s'associent au hasard (pangamie) Ö probabilité de se croiser avec un individu de génotype donné = fréquence de ce génotype dans la population Exemple: l locus l Lap-1 1 chez h lles Lillois: ill i 4% FF; 32% FS; S 64% SS Si panmixie, en moyenne une Lilloise, indépendamment de son génotype Lap-1, va choisir pour se reproduire (si elle choisit un partenaire Lillois): – partenaire i FF avec 1 chance h sur 25 – partenaire FS avec 8 chances sur 25 – partenaire SS avec 16 chances sur 25 2.1. Modèle de ppopulation p "idéalisée" • Hypothèse yp de p panmixie: – Panmixie relative au caractère considéré: une même population peut se reproduire de manière • panmictique p/r à un caractère (locus Lap-1) • non aléatoire p/r à un autre caractère (couleur peau, taille, date floraison,…) – écart à la panmixie Ö consanguinité : • autofécondation: 2 partenaires génétiquement identiques • croisements entre cousins: 2 partenaires plus similaires génétiquement que 2 individus choisis au hasard 2.1. Modèle de ppopulation p "idéalisée" • Hypothèses du modèle de population de Hardy-Weinberg – – – – – – – – – – organisme diploïde reproduction sexuée générations non chevauchantes locus considéré possède 2 allèles fréquences alléliques identiques chez les individus mâles et femelles panmixie p/r locus considéré population de très grande taille (∞) migration entre populations négligeable mutation négligeable sélection naturelle n'agit g ppas au locus considéré 2.1. Modèle de population "idéalisée" (tiré de Solignac et al. 19995) Conceptualisation du modèle de population de Hardy-Weinberg 2.2. Principe de Hardy-Weinberg • Formulé en 1908 indépendamment par: – G.H. Hardy (1877-1947): mathématicien anglais – W. Weinberg (1862-1937): physiologiste allemand • Si les hypothèses du modèle de Hardy-Weinberg sont respectées, on peut prédire exactement les fréquences génotypiques à partir des fréquences alléliques de la population – F Fréquences é alléliques: lléli A (p); ( ) a (q ( = 1-p) 1 ) – Fréquences génotypiques: AA (P); Aa (Q); aa (R) H-W: AA→p2 Aa→2pq aa→q2 Clé: association des gamètes pour formation des zygotes = événements indépendants Ö développement du binôme: (p A + q a)2 = p2 AA + 2pq Aa + q2 aa 2.2. Principe de Hardy-Weinberg Fréquences alléliques: A (→p); a (→q = 1-p) Fréquences génotypiques: AA (P); Aa (Q); aa (R) H-W: AA→p2 Aa→2pq aa→q2 {( A + q a))2 = p2 AA + 22pq Aa {(p A + q2 aa}} (tiré de Hartl, 1994) → événements indépendants! 2.2. Principe de Hardy-Weinberg • Le principe de Hardy-Weinberg découle du fait que la reproduction aléatoire entre génotypes est équivalente à l'union au hasard des gamètes Les valeurs de P', Q' et R' ne dépendent pas de P, Q, et R ! Ö fréquences génotypiques de H-W atteintes en 1 génération! (tiré de Hartl, 1994) 2.2. Principe de Hardy-Weinberg • Implications du principe de Hardy-Weinberg: – Une seule génération de panmixie suffit pour atteindre les fréquences génotypiques de Hardy-Weinberg (en général) – Selon les hypothèses yp du modèle de Hardy-Weinberg, y g, les fréquences q alléliques restent constantes Ö absence d'évolution au locus considéré Ö maintien du polymorphisme génétique fréq.(A): p' = P'+Q'/2 = p2+2pq/2 = p(p+q) = p – Base pour élaboration de modèles + complexes: séparation en 2 phases • gamètes g Î zygotes yg (fréquences ( q génotypiques g yp q à naissance déterminées par p H-W si panmixie Ö inchangé) • zygotes Î adultes (ajouter effet de sélection ou de la migration) Ö changement des fréquences alléliques 2.1. Modèle de population "idéalisée" (tiré de Solignac et al. 19995) Conceptualisation du modèle de population de Hardy-Weinberg