10/09/15 La génétique des populations La génétique des populations DEFINITIONS: Génétique des populations: Etudier la variation, d'une génération à l'autre, des fréquences des gènes dans les populations. • Gène : unité d'information biologique, transmise au cours des générations, codant pour une fonction. Correspond à une séquence d'une macromolécule (ADN ou ARN) transmise, transcrite et généralement traduite par un système biochimique, ce qui permet l'expression d'une activité biologique. La base: J.P. Henry, P.H. Gouyon. 2008. Précis de génétique des populations Ed: Dunod (20€) • Locus : historiquement, position du gène sur le chromosome. En génétique des populations, ensemble de gènes homologues (classe d'homologie). Deux gènes sont homologues s’ils s’apparient à la méiose. Plus complet: D.L. Hart & Clark. 2007. Principles of populations genetics. Ed: Sinauer (98€) • Gènes allèles : deux gènes homologues sont dits allèles quand ils ont des formes différentes, distinguables à un niveau d’observation donné. Un allèle, c’est une classe de gènes homologues qu’on ne distingue pas entre eux. Un allèle peut correspondre à une seule séquence, ou à un ensemble de séquences différentes mais non distinguables au niveau du phénotype. 1 La génétique des populations V V V J V J J J La génétique des populations Constitution phénotypique Constitution génotypique Constitution allélique en fréquence relative Sous réserve que la variation phénotypique soit génétiquement déterminée, la variation des fréquences des phénotypes correspond à une variation sous-jacente des fréquences des génotypes V V Constitution phénotypique : 4/5 [V] ; 1/5 [J] Constitution génotypique : 2/5 VV ; 2/5 VJ ; 1/5 JJ Constitution allélique : 6/10 V ; 4/10 J 2 Génétique des populations : formalisation de l'évolution des fréquences génotypiques et alléliques sous l'effet de différentes forces évolutives et des régimes de reproduction 3 4 1 10/09/15 La génétique des populations Variation: * individuelle, intrapopulation La génétique des populations Mesures de la variation: fréquences génotypiques et alléliques * géographique, interpopulation et indices plus synthétiques comme - nombre moyen d’allèles par locus * génétique ou environnementale - pourcentage de locus polymorphes Polymorphisme génétique (variation discontinue): * morphologique (à 95%: l’allèle le plus fréquent ne doit pas dépasser 95 %; à 99%) * protéique (enzyme) - hétérozygotie théorique (voir plus loin) * acides nucléiques (RFLP, microsatelites, séquence, SNP) * chromosomique 5 1. Structure génétique d’une population = Les fréquences alléliques et génotypiques 1. Structure génétique d’une population N individus diploïdes = 2N gènes au locus considéré fréquences génotypiques D = f(AA) = Nb(AA) / N H = f(Aa) = Nb(Aa) / N R = f(aa) = Nb(aa) / N D+H+R=1 1 locus, 2 allèles A et a N individus haploïdes = N gènes au locus considéré fréquences génotypiques = fréquences alléliques : D = f(A) = Nb(A)/N R = f(a) = Nb(a)/N p=D q = 1-p = R 6 fréquences alléliques p = f(A) =Nb(gènes A) / 2N q = f(a) = Nb(gènes a) / 2N p+q = D+R =1 7 p = [2 Nb(AA) + Nb(Aa)] / 2N = D + H/2 q = R + H/2 p+q =1 8 2 10/09/15 1. Structure génétique d’une population 2. Régimes de reproduction Manière dont les gamètes s’assemblent pour former la génération suivante. fréquences génotypiques fréquences alléliques fréquences alléliques fréquences génotypiques ? 2.1. La panmixie = croisements au hasard des individus ou gamètes pour le locus étudié p=q=0,5 AA 0,2 0,4 Aa 0,6 0,2 aa 0,2 0,4 = le fait de connaître le génotype d’un parent ne renseigne en rien sur le génotype de l’autre parent. 9 2. Régimes de reproduction 10 2. Régimes de reproduction Modèle de G.H.Hardy et W.Weinberg - 1908 H1: les gamètes s’associent au hasard / gène considéré H2: la population a une taille infinie donc la fréquence d’un événement est égale à sa probabilité H3: la fréquence des gènes n’est pas modifié par la mutation, la sélection, la migration Population diploïde, 1 locus avec 2 allèles A et a, de fréquence p et q. Mâle _______ Femelle A p a q=1-p A p AA p2 Aa pq a q=1-p aA qp aa q2 D’où: AA 11 p2 Aa aa = structure de 2pq q2 Hardy-Weinberg 12 3 10/09/15 2. Régimes de reproduction 2. Régimes de reproduction Test de conformité à la structure de Hardy-Weinberg p’ = D'+H'/2 = p²+2pq/2 = p²+pq = p(p+q) = p q’ = R'+H'/2 = q²+pq = q Donc p et q constantes Loi de Hardy-Weinberg * Dans une population isolée, d’effectifs illimités, non soumise à la sélection et dans laquelle il n’y a pas de mutation: les fréquences allèliques restent constantes. * Si les accouplements sont panmictiques, les fréquences génotypiques se déduisent directement des fréquences alléliques - elles sont donc aussi constantes. € 13 2. Régimes de reproduction Gn+1 aa total effectifs observés N1 N2 N3 N effectifs attendus Np2 N2pq Nq2 X= (effectif attendu − effectif observé) 2 effectif attendu génotypes X= (Np 2 − N1 ) 2 (N2 pq − N 2 ) 2 (Nq 2 − N 3 ) 2 + + Np 2 N2 pq Nq 2 p=2N1+N2 / 2N q=2N3+N2 / 2N ∑ degrés de liberté = nbre de catégories - contraintes = nbre de catégories - 1 - nbre de paramètres estimés Voir table du χ2 14 2.2. L’autofécondation ou autogamie totale AA Aa aa fréquences alléliques? Dn Hn Rn pn+1 = Dn+1+½ Hn+1 = Dn+¼ Hn +½. ½ Hn = Dn+½ Hn = pn AA AA Aa aa aa Dn+¼ Hn Hn+1 = ½ Hn Aa 2. Régimes de reproduction 2.2. L’autofécondation ou autogamie totale Gn AA ½ Hn donc H tend vers 0 Donc restent constantes. fréquences génotypiques à l’équilibre? en TD Rn + ¼ Hn 15 16 4 10/09/15 2. Régimes de reproduction 2. Régimes de reproduction 2.3. Le régime mixte h2 − h1 = s s d’autofécondation et (1-s) d’allofécondation h1 − h0 2 2 h1 = (1 − s )(2 pq ) + s ht +1 − ht = s h0 2 h2 = (1 − s )(2 pq ) + s ht − ht −1 ' s $ = % " (ht −1 − ht − 2 ) 2 &2# t 's$ = ...... = % " (h1 − h0 ) &2# h1 2 s < 2. Donc ht+1 − ht → 0 quand t → +∞ Donc pour t assez grand, he = cste 17 2. Régimes de reproduction 2. Régimes de reproduction taux d'hétérozygotes à l'équilibre ? he = (1 − s )(2 pq ) + s 18 Fis = indice de fixation défini comme Hobs = 2pq (1-Fis) he 2 1− Fis = soit : ' s$ he %1 − " = (1 − s )(2 pq ) & 2# 2(1 − s ) he = 2 pq 2−s € 19 Fis = 2(1− s) 2−s s 2−s 20 € 5 10/09/15 2. Régimes de reproduction Déficit en hétérozygotes Fis en fonction de s Fis = 1 0,8 0,6 0,4 0,2 0 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 s, tauxd'autofécondation 2. Régimes de reproduction s 2−s EXEMPLE : Medicago truncatula, luzerne annuelle Marqueurs microsatellites 1 € Influence du taux d'autofécondation (s), sur la structure génotypique de la population But : déterminer le taux d’autofécondation à partir de la structure génotypique mesurée en pop. nat. (p.ex. avec 21 marqueurs moléculaires) 2. Régimes de reproduction He = hétérozygotie théorique EXEMPLE : Medicago truncatula, luzerne annuelle Locus Allele size (pb) MTSA5 215 235 239 241 243 245 251 He Fis A1 (N=130) 0.688 0.088 0.158 0.027 0.012 0.027 0.495 0.891 A2 (N=125) 0.420 0.016 0.016 0.104 0.444 0.620 0.961 A3 (N=108) 0.028 0.523 0.009 0.426 0.014 0.549 0.933 22 Si deux allèles: 2pq Aude 0.399 0.193 0.008 0.219 0.010 0.161 0.010 Si plus de deux: H e = ∑ 2 pi p j = 1− ∑ pi2 i< j i 2 2 2 H e = 1− p215 − p235 − p239 ..... 23 24 6 10/09/15 2. Régimes de reproduction Le taux d’autofécondation n’est pas seulement un paramètre du système de reproduction : il évolue ! EXEMPLE : Medicago truncatula, luzerne annuelle Locus MTSA5 MTSA6 MT660252 MT660456 MT660538 Tous locus He Fis He Fis He Fis He Fis He Fis He Fis 1er transect 2ème transect3ème transect 0.495 0.620 0.549 0.891 0.961 0.933 0.379 0.612 0.574 0.848 0.920 0.932 0.060 0.039 0.352 1.000 0.797 0.922 0.366 0.765 0.550 0.979 0.979 0.948 0.440 0.165 0.354 0.913 0.952 0.974 0.348 0.440 0.476 0.910 0.950 0.940 Cyclamen repandum Cyclamen balearicum Autofécondation Réduction florale 25 (diapo : P.O. Cheptou et John Thompson, Cefe-CNRS Montpellier) 26 2. Régimes de reproduction Une transition fréquente au cours de l’évolution : de l’allofécondation à l’autofécondation Exemple : le genre Amsinckia (Boraginaceae) 2.4. Régimes de reproduction fermés - autofécondation - consanguinité: les unions se font entre apparentés préférentiellement conséquences ? - homogamie: les unions se font entre individus qui se ressemblent “Nevertheless, self-fertilizing species are usually the ends of evolutionary lines and rarely if ever contributed to major evolutionary trends” (Stebbins, 1974) (diapo : P.O. Cheptou, Cefe-CNRS Montpellier) 27 conséquences ? Différence entre les deux ? 28 7 10/09/15 2. Régimes de reproduction 3. Structure génétique des populations 3.1. Description d’une structure de population quelconque 2.5. Régimes de reproduction ouverts - hétérogamie: les unions se font entre individus phénotypiquement dissemblables S1 S3 S1 S3 S1 S2 S3 S4 S1 S3 S1 S2 gamétophytique ? S1 S2 sporophytique avec codominance aa fréquences D H R si panmixie p2 2pq q2 sinon: H = 2pq(1-F) avec F∈[-1,1] autres génotypes? 29 3. Structure génétique des populations 3.1. Description d’une structure de population quelconque 30 3. Structure génétique des populations 3.1. Description d’une structure de population quelconque AA Aa aa D H R AA Aa aa ? p2+pqF 2pq(1-F) q2 +pqF (1-F)p2 +Fp (1-F)2pq (1-F)q2 +Fq ? H on a : p = D + 2 Aa sporophytique avec dominance Attention: crée de la fréquence dépendance donc modifie les fréquences alléliques. fréquences AA S3 S4 2pq(1-F) H 2 pq(1− F) donc D = p − = p − = p − pq(1− F) 2 2 D = p(1− q) + pqF = p 2 + pqF D = p 2 (1− F ) + p 2 F + pqF = p 2 (1− F ) + pF F 31 système de reproduction ? 32 8 10/09/15 3. Structure génétique des populations 3. Structure génétique des populations 3.2. Populations structurées 3.2. Populations structurées Il n’est pas toujours évident sur le terrain de reconnaître une population. Que se passe-il si on a échantillonné sur une zone plus grande qu’une population panmictique? Exemple numérique : population 1 : population 2 : p1 q 1 p2 q 2 k Si chaque pop est à HW : Aa obs1 = 2*0,2*0,8 = 0,32 Aa obs2 = 2*0,8*0,2 = 0,32 donc en moyenne 0,32 et 0,32 < 0,5 ? Exemple: Une fraction k des individus prise dans une sous-populations 1, et le reste dans une sous-population 2. 33 34 3. Structure génétique des populations 3. Structure génétique des populations 3.2. Populations structurées k 3.2. Populations structurées H att − H obs = .... = 2k(1− k)( p1 − p2 ) 2 p2 q 2 ? >0 si mélange et si 1-k € On va observer : k2 p1q1 + (1− k)2 p2 q2 Sur l’ensemble : P = kp1 + (1− k) p2 et on s’attend à : 2PQ hétérozygotes p1 ≠ p2 EFFET WAHLUND H obs = H att (1− Fst ) H −H H Fst = att € obs = 1− obs H att H att hétérozygotes € 2 H att − H obs € = 2PQ − (k2 p1q1 + (1− k)2 p2 q2 ) = k(1− k)(p1 − p2 ) € a q1=0,8 q2=0,2 k = 1-k = 1/2 Sur l'ensemble p=q=0,50, 2pq=0,50 1-k p1 q 1 A p1=0,2 p2=0,8 35 FST = paramètre d’écart à la panmixie sur l’ensemble des populations, dû à l’hétérogénéité des fréquences alléliques entre populations. 36 9 10/09/15 3. Structure génétique des populations 3. Structure génétique des populations 3.2. Populations structurées 3.2. Populations structurées Démonstration générale: H obs = H att (1− Fst ) H − H obs H Fst = att = 1− obs H att H att Soit un locus avec 2 allèles A et a. Soient n populations panmictiques de fréquences alléliques pi et qi=1-pi (i=1,..,n). On suppose n infini € Dans chaque population i : AA Aa aa pi² 2piqi qi² E(2piqi) E(qi²) En moyenne sur l'ensemble : E(pi²) FST = 2PQ − 2E ( piqi ) 2PQ € 37 3. Structure génétique des populations 3.2. Populations structurées FST = 38 3. Structure génétique des populations 3.3. Les F-statistiques 2PQ − 2E ( piqi ) 2PQ F-statistiques Déficits en hétérozygotes dus aux flux géniques réduits entre individus et entre populations différentes 2 E( piqi ) = E ( pi (1− pi )) = E ( pi − pi ) = E( pi ) − E ( pi2 ) = P − E( pi2 ) € I=individu S=sous-population T=totale 2 Or Var( pi ) = E ( pi2 ) − ( E ( pi )) = E ( pi2 ) − P 2 € € € FST = PQ − P + Var( pi ) + P 2 PQ HI: hétérozygotie d’un individu dans une sous population HS: hétérozygotie attendue d’un individu dans une sous population équivalente en panmixie 2 FST = € P(1− P) − P + P + Var( pi ) Var( pi ) = PQ PQ 39 HT: hétérozygotie attendue d’un individu dans une population totale équivalente 40 € 10 10/09/15 3. Structure génétique des populations 3. Structure génétique des populations 3.3. Les F-statistiques 3.2. Populations structurées - les F-statistiques HI : hétérozygotie d’un individu dans une sous population HS : hétérozygotie attendue d’un individu dans une sous population équivalente en panmixie HT : hétérozygotie attendue d’un individu dans une population totale équivalente FIS = HS − HI H = 1− I HS HS i FIS = 1− H iobs FIS i = 1 − H i obs 2 piqi FST = 1 − 2 piqi 2PQ FIT = 1 − H obs 2PQ 2 pi qi 2 pi qi = 1− 2PQ FST = HT − H S H = 1− S HT HT FST FIT = HT − H I H = 1− I HT HT FIT = 1− On a: (1-FIT) = (1-FIS)(1-FST) Les F permettent de décrire la structure génotypique d’une population structurée spatialement en différenciant les effets de cette structure spatiale et les effets du système reproduction. H obs 2PQ 41 € NB: en pratique, pas toujours évident 42 11