Génétique des populations Génétique évolutive [email protected] http://genet.univ-tours.fr//fichiers_de_base/gen001700.htm Introduction 1 - Qu’est ce que la génétique des populations ? A quoi sert-elle ? Gène : unité d’information biologique, transmise au cours des générations (codant pour une fonction) Séquence d’une macromolécule (ADN ou ARN) transmise telle quelle (à des rares modifications prés), transcrite et généralement traduite ce qui permet l’expression d’une activité biologique. Locus : historiquement, position d’un gène sur un chromosome. Allèle : Les copies homologues d’un gène sont dites allèles quand elles ont des formes de différents, distinguables à un niveau d’observation donné. Un allèle peut donc correspondre à une seule séquence, ou à un ensemble de séquences différentes mais non distinguables au niveau du phénotype. (ex : couleur des yeux bleu/marron/vert mais au niveau du nucléotide on a beaucoup plus d’allèles différents, plusieurs par couleur). Homozygote : individu portant deux allèles identiques au même locus. Hétérozygote : individu portant deux allèles différents au même locus. Le phénotype de l’hétérozygote (état observable du caractère) définit la dominance/récessivité des allèles. (Est dominant l’allèle qui impose son phénotype à l’hétérozygote). Génétique « classique » On connait ou on cherche à connaître le génotype des individus et de leur descendance « Vous portez l’allèle muté, vous avez une probabilité de ½ de transmettre cet allèle à votre enfant » Génétique des populations On ne peut avoir accès au génotype de tous les individus. On va donc utiliser une approche statistique. « Dans la population française, la fréquence de la maladie est de 1/250 000 » Concept de fréquence La génétique des populations est basée sur l’existence d’une variabilité génétique elle concerne de nombreux gènes avec plusieurs allèles (Ex. couleur des yeux, isoenzymes, mutations ponctuelles…), ou des changements de fréquences alléliques (évolution des populations, des espèces) Mesure de la variabilité génétique dans et entre les populations – Retrace l’histoire évolutive des espèces Quantification – description Explique les modifications observées dans le temps et l’espace : forces évolutives Explication Prédiction « Rien en biologie n’a de sens, … si ce n’est à la lumière de l’évolution » Th. Dobzhanski En Systématique (classification des êtres vivants) En physiologique (fonctionnement des êtres vivants) - Explique la mise en place des fonctions (hasard et nécessité) En biologie moléculaire (évolution moléculaire) etc… La génétique évolutive recherche la cause ultime d’un phénomène (par opposition aux causes proximales), elle répond aux questions : Pourquoi cet allèle et quel est son devenir. Domaine d’application de la génétique des populations : Médecine – génétique humaine : Epidémiologie des maladies génétiques (mutation – sélection) (6000 connues chez l’homme). Effets de la consanguinité Amélioration génétique animale et végétale. Sélection artificielle OGM (dissémination, impact sur l’environnement) Espèces « invasives » (ex. mimosa, figuier d’Espagne …) (espèce ayant été introduite sans ses parasites, donc fort développement) Réintroduction des espèces Conservation génétique, biodiversité Mais qu’est ce qu’une population ? L’ensemble des individus de la même espèce qui ont la possibilité d’interagir entre eux au moment de la reproduction. Correspond à un pool génétique : ensemble des génotypes pour chacun des gènes. Pourquoi s’intéresser au niveau « population » ? Une unité écologique Une unité évolutive Individus en interaction avec l’environnement La génétique des populations est probabiliste : Grand nombre d’individus Grand nombre de générations Grand nombre de populations Facteurs évolutifs multiples Difficile d’expérimenter ! Elle nécessite donc souvent l’utilisation de simulations et modélisations (et de quelques calculs de probabilités) La théorie de l’échantillonnage : Echantillon – estimation de la fréquence des allèles Extrapolation à la population globale 2 – La variabilité génétique Pas deux individus semblables Variabilité morphologique Chromosomique Comportementale Physiologique Biochimique (protéines) Moléculaires (protéines, ADN) Individuelle ou géographique (races ou variétés) Chromosomes polyténiques : correspondent à un certain nombre de copies des chromatides (jusqu'à 1000) qui sont restées soudées entre elles (dans les glandes salivaires des drosophiles par exemple). Les caractères étudiés doivent être génétiquement déterminés. Prouver le déterminisme génétique : caractère héritable, ségrégation mendélienne (Sauf étude de gènes « cytoplasmiques » tels que gènes mitochondriaux, chloroplastiques…) Variabilité épigénétique, plasticité phénotypique et norme de réaction = caractère conditionné par le milieu. Des individus à génotype identique peuvent avoir des phénotypes différents selon le milieu (température…). Différents phénotypes sont possibles selon la « norme de réaction » (ex : larve – adulte, castes, variation saisonnière, homochromie…). Il existe une variation épigénétique due aux milieux instables : on peut citer par exemple le mourron rouge ou bleu selon la nature du sol. La source de la variabilité génétique Ségrégation méiotique et recombinaison Mutations (ponctuelles, remaniements chromosomiques, …) La mutation est un phénomène « aléatoire » Effet variable sur les individus (favorable, neutre, délétère, létale) Une même mutation peut avoir des effets phénotypiques différents suivant l’environnement. Exemple de la phénylcétonurie chez l’homme (mutation phénylalanine hydroxylase (PHA)) Quantification du niveau de variabilité d’une population Populations de drosophiles Gènes « morphologiques », 3-5 mutations par individu, à l’état hétérozygote. Tout individu est porteur d’un allèle létal (hétérozygote) pour deux gènes en moyenne. Taux de polymorphisme P Proportion de gènes polymorphes parmi l’ensemble des gènes étudiés. Polymorphisme : gène pour lequel il existe au moins deux allèles et dont l’allèle le plus fréquent a une fréquence inférieure ou égale à 95% (ou 99%) Sinon, cryptopolymorphisme (fréquence inférieur a 1 % ; les maladies génétiques humaines sont en général dans ce cas). Taux d’hétérozygotie Ho : moyenne des fréquences des hétérozygotes observés à chacun des loci. Ho = 1/N* N nombre de loci ; Hi, hétérozygote au locus i Chez l’homme P=0,3 pour loci enzymatique : Ho = 0,067 Invertébrés > plantes > vertébrés Diversité génique : Probabilité d’avoir deux allèles différents à un même locus en prenant deux allèles au hasard dans la population. On l’estime par He = 2n(1-Σpi²)/(2n-1) Avec n nombre d’individus étudiés ; Pi la fréquence de l’allèle i dans la population. Valable quel que soit le degré de ploïdie et le mode de reproduction Variabilité au niveau nucléotidique Indice de diversité nucléotidique : Nombre moyen de nucléotides différents entre deux séquences prises au hasard au même locus. Valeur voisine de 1% = π Ex : ADH chez D. melanogaster Diversité 6,25 nucléotides sur 765 soit 0,0082 Ex : Locus microsatellite chez l’homme 80% d’hétérozygotie Le modèle de HARDY-WEINBERG (1908) G. Hardy (mathématicien anglais) W. Weinberg (médecin allemand) Codécouverte indépendante A. Le modèle Considérons un gène à deux allèles A et B, de fréquence p et q (individus diploïdes). Regardons la constitution génétique à la génération n puis n+1, en considérant des générations non chevauchantes. Gamètes Gn zygotes Gn+1 Reproducteurs Gn+1 gamètes Gn+1 Les hypothèses et la loi Hardy-Weinberg Définition d’une population théorique idéale, Organismes diploïdes à reproduction sexuée, et générations non chevauchantes. Pas de mutation. Population d’effectif infini = pas de dérive, pas de sélection. Croisement entièrement aléatoires = panmixie Population génétiquement close = pas de migration pas de distorsion de ségrégation méiotique. Absence de sélection naturelle Go AA Aa aa G1 f(AA) = p² f (aa) = q² f(Aa) = 2pq G2 f(AA)= p² f(aa) = q² f(Aa) = 2pq p = f(A)= = = = + =f(AA)+ ½ f(Aa) q= f(a) = =f(aa)+ ½ f(Aa) p+q= 1 = f(AA)+ ½ f(Aa) + f(aa)+ ½ f(Aa) Si la population est à effectif fini on aura G0 A≠p et B≠q car gamètes tirées au sort et G1 AA≠p² AB≠2pq BB≠q² Changement des fréquences si absence de pangamie (rencontre au hasard des gamètes) ou panmixie (rencontre au hasard des individus). Survie différentielle des génotypes. Sélection naturelle Fécondité différentielle des génotypes. Survie + fertilité = valeur sélective. Changement des fréquences si les valeurs sélectives des génotypes dont différentes. Apport de nouveaux individus : migration (d’adultes reproducteurs ou de gamètes (chez individus à fécondation externe)) Changement des fréquences si les fréquences génotypiques dans la population d’immigrants sont différentes de celles de la population étudiée. Mutation dans les cellules de la lignée germinale : changement des fréquences du à des mutations. Distorsion de ségrégation méiotique : A > ½ ; B < ½ ex : haplotype t chez la souris, gène égoïste. Si les conditions sont respectées, on atteindra un équilibre (dit équilibre de HW) en une génération. Sous HW, on peut décrire les fréquences génotypiques à partir des fréquences alléliques et réciproquement. B. Constitution génétique des populations Phénotype : états possibles du caractère. Probabilités de rencontre de ces états. Constitution phénotypique. Génotype : génotypes possibles pour ce locus. Probabilités de rencontre de ces génotypes. Constitution génotypique. Allèle : allèles possibles à ce locus. Probabilités de rencontre de ces allèles. Constitution allélique. Phénotype [1] [2] [3] Nombre n1 n2 n3 Σ=N 1 gène à 2 allèles codominants Génotypes Fréquence AA n1/N AB n2/ N BB n3/ N Σ= 1 Fréquence de A= (2n1+n2)/2N Fréquence de B = (2n3+n2)/2N Σ(fréquence de A + fréquence de B) = 1 Exemple du groupe sanguin MN chez l’homme. L’examen de 730 aborigènes australiens a donné les résultats suivants : Groupe sanguin [M] [MN] [N] Phénotype Nombre Génotype MM MN NN [1] n1 [2] n2 Nombre 22 216 492 Σ=N 1 gène à 2 allèles, A>a Génotypes Fréquence AA ? Aa ? aa n2/N Question subsidiaire : Que devient le modèle de HW si les fréquences alléliques pour un gène autosomal sont différentes chez les mâles et les femelles à la génération n ? Il faudra : Une génération pour égaliser ces fréquences (la fréquence obtenue est la moyenne des fréquences chez les males et femelles) Une génération pour atteindre l’équilibre de HW C. Applications Application 1 : Comment savoir si une population est à l’équilibre de HW pour un gène ? Si A p alors AA AB BB B q p² 2pq q² Groupe sanguin Génotype Nombre [M] MM 22 [MN] MN 216 [N] NN 492 =0,178 =0,82 p = 0,18 q = 0,82 Test de conformité d’une loi expérimentale à une loi théorique H0 : population en équilibre de HW pour ce gène H1 : population pas en équilibre de HW AA AB Sous H0, on a des fréquences attendues p² 2pq 0,18² 2*0,18*0,82 Effectifs attendus : on multiplie les fréquences part N (730) 23,65 215,5 On compare aux effectifs observés 22 216 BB q² 0,82² 490,85 730 492 730 Mesure de l’écart entre les effectifs théoriques et effectifs observés : – X²=Σ =0,118 Suit une loi de Khi-2. Deux paramètres : ddl= nombre de degrés de liberté et α= risque d’erreur de première espèces (0,05) Test de conformité d’une loi expérimentale à une loi théorique (est-ce que la population est à l’équilibre de HW pour ce gène ?) Dans ce cas le nombre de ddl est le nombre de comparaison effectuées – 1 – (nombre de paramètres indépendants estimés pour calculer les valeurs théoriques). Ici ddl = 3- 1 – 1 (estimation de p) = 1 Génotypes Phénotypes Cas d’un locus diallélique, quand A>a Population à l’équilibre d’HW ? On ne peut pas tester. Soit p la fréquence de A ; p = f(AA) + ½ f(Aa) f([A])= f(a) = = f(aa) Ssi la population est à l’équilibre d’HW Alors f ([a]) = q² = f(aa) q= p = 1-q Pour un gène lié au sexe : Sexe homogamétique : XX ou ZZ Hétérogamétique : XY ou ZW 1 locus diallélique : XA Soit p=f(XA) et q=f(Xa) Xa Si la population est à l’équilibre d’HW : Pf=pm AA Aa [A] [A] n1 aa [a] n2 = f(AA)+ f(Aa) Femelle : XAXA p² XAXa 2pq XaXa q² mâle : XAY p XaY q Les écarts aux conditions d’HW. La mutation Reproducteurs gamètes Génération n génération n+1 AA p² Ap Aa 2pq a q Aa q² Mutation récurrente µ A a µ taux de mutation Pn+1 = Pn(1-µ) = pn-pn*µ Equilibre si pn+1=pn ou pn+1 – pn = 0 Δp=0 Δp=0 Δp= pn+1 – pn = pn - µpn - pn Δp= - µpn A l’équilibre Δp= 0- µpn = 0 Pe = 0 Pn+x ? pn+1 = (1-µ)pn pn+2 = (1-µ) (1-µ) pn = (1-µ)² pn Pn+x =(1-µ)x pn Pn= 1 µ = 10-6 mutations/gamète/génération pn+10= (1- 1.10-6)10 * 1 = 0,99999 Avec mutation inverse µ A a υ pn+1 = pn - µpn + υpn = pn - µpn + υ(1-pn) = pn - µpn + υ - υpn pn+1 = pn (1-µ- υ) + υ A l’équilibre Δp= pn+1 – pn est nul à l’équilibre Δp= 0 pe (1-µ - υ) + υ - pe = 0 pe = Pour passer de p = pn à p = pn+x X= ln Avec µ = = 5. 10-5 il faut 6930 générations pour passer de p = pn à p=pn/2 Mutations non récurrentes 4900 séquences différentes de 900 nucléotides. ≈10542 La sélection La sélection naturelle désigne le fait que les traits qui favorisent la survie et la reproduction, voient leur fréquence s'accroître d'une génération à l'autre. Sélection compétitive : La valeur sélective du génotype, est dépendante du génotype du milieu et de la fréquence du génotype. Sélection sexuelle, phénomène de choix du partenaire, c’est un des modes les plus fort de sélection. L’adaptation est la capacité à laisser le plus de descendants. Sélection non compétitive : La valeur du génotype, est constante quelle que soit la compo de la pop. La valeur sélective du génotype n’est du qu’au génotype et au milieu Valeur sélective w (fitness) nb moyen de descendants laissé par tous les individus d’un génotype. Dépend des facteurs de survie o de l’adulte reproducteur o du zygote de fécondité o capacité à se reproduire o fécondité de l’adulte Supposons un locus à 2 allèles. génotypes Valeurs sélectives Relative AA w1 1 1 AB w2 w2/w1 1 – S2 BB w3 w3/w1 1-S3 Valeur sélective moyenne w soit p = f(A) et q=f(B) w= w1 p² + w2 2pq + w3 q² génotypes AA Valeurs sélectives w1 Fréquence avant sélection p² Fréquence après sélection p’= f’(AA) + ½ f’(AB) = AB w2 2pq valeur sélective absolue S2 et S3 coefficients de sélection BB w3 q² Ap Bq (panmixie) après sélection +½ p’= p=p’- p a l’équilibre p=0 p=p’- p = p= -p On peut ainsi chercher les conditions d’équilibre p tel que p=0 ? pe=0 pe= 1 ds ces 2 cas on a fixation d’un allèle, donc plus de sélection car on n’a plus qu’un allèle. (w1 – w2)pe + (w2-w3)qe = 0 (w1 – w2) pe + (w2-w3)(1-pe)=0 (w1 – w2) pe + (w2-w3) + (w3 – w2)pe = 0 Pe (w1 – w2 + w3 – w2) = w3 – w2 Pe= cet équilibre polymorphe n’est pas toujours possible (si < 0) w1≥ w2 ≥ w3 A>B w1≥ w2 ≥ w3 A<B p>0 car (w1-w2)p + (w2-w3)q > 0 P’-p >0 P’ > p w1<w2≤w3 A>B w1≤w2<w3 A<B (w1- w2)p + (w2-w3)q < 0 p<0 Pe = 0 stable Pe = 1 instable w2 > w1 et w3 avantage à l’hétérozygote pe=0 instable pe= 1 instable (w1 – w2)pe + (w2-w3)qe = 0 stable w2< w1 et w3 Désavantage à l’hétérozygote (w1 – w2)p + (w2-w3)q p>0 pe=0 stable pe= 1 stable (w1 – w2)pe + (w2-w3)qe = 0 sélection disruptive instable Adaptation w1>w2>w3 Afixé A l’équilibre pe = 1 , qe= 0 w = w1 w= w1 p² + w2 2pq + w3 q² A l’équilibre qe = 1 pe=0 w=w3 A l’équilibre pe = w = w1pe² + 2w2peqe + w3q² w3>w2>w1 w2>w3 et w1 w2<w3 et w1 Calcul des valeurs sélectives Nombre de zygotes Sélection (viabilité ; fécondité) AA 30 AB 50 BB 20 N=100 Nombre de zygotes fournis à la génération suivante 60 90 30 N=180 valeurs sélectives absolues Valeurs sélectives relatives Coefficient de sélection Allèle récessif létal A>a Valeurs sélectives Génération n avant sélection Après sélection AA 1=w1 pn² =2 w1 w1 = 1 =1,8 w2 w2= =0,9 w1 = 1-S1 S1 = 0 w2 = 1-S2 S2 = 0,1 Aa 1=w2 2pnqn aa 0=w3 qn² p = f(A) et q= f(a) (panmixie) w= w1pn²+2w2pnqn+w3qn² qn+1 = fn+1 (aa) + ½ f n+1 (Aa) = +½ = = = qn+2 = = = = qn+x = Les écarts aux conditions d’HW Croisements non panmictiques : Homogamie ≠ hétérogamie Consanguinité o Autofécondation chez hermaphrodites. Autofécondation stricte AA * AA AA Aa * Aa ¼AA ½Aa ¼aa aa * aa aa Hn = fn (Aa) Hn+1= ½ Hn Hn+x = (½)x Hn Dn = fn (aa) Dn+x=Dn+Hn (1 – (½)x) * ½ Disparition des hétérozygotes Homogamie Génotypique Phénotypique Hétérogamie : excès d’hétérozygotes =1,5 w3 w3 = = 0,75 w3 = 1-S3 S3=0,25 Consanguinité : choix ; position ; population de petite taille Deux individus sont apparentés s’ils ont au moins un ancêtre en commun Consanguin : issu d’un croisement entre apparentés Apparentés : K-L par C et D H – I par C et D Consanguins : M par K et L Allèles identiques par descendance. M autozygote Coefficient de consanguinité (Malécot, 1948) fI pour l’individu I Coefficient de parenté entre P et M fPM PGK = (½)n1 PCL = (½)n2 n1 = nombre de liens entre C et K = 2 n2 = nombre de liens entre C et L = 2 fKL = (½)n1 * (½)n2 = (½)n n=n1 + n2 p (HI même allèle que L)= ( ½ * ½ ) + ( ½ * ½ ) + ½ fC fKL = (½)n * ( ½ + ½ fC) fI = Ci = nombre de chaines de parenté pointant sur Ai nij = nombre d’individus dans la chaine Cj allant reliant les parents de I par Ai 1) ancêtres communs A et B 2) Chaines de parentés K A L : (½) 3 (1+fA) K B L : (½)3 (1 + fB) 3 3 FI = (½) (1+fA) + (½) (1 + fB) (probabilité d’être autozygote) 3) Contribution de chaque chaine 4) Somme des contributions Dans la population F (coefficient de consanguinité moyen) Un locus diallélique f(AA) = (1-F) p² + Fp = p² - Fp² + Fp = p²+ Fp(1-p) A et B de fréquence p et q f(AA) = p² + Fpq f (BB) = (1-F)q²+Fq f(BB) = q² + Fpq f(AB) = (1-F) 2pq Danger à faire de la consanguinité pour : Allèles récessifs délétères ex : allèles létaux Dépression de consanguinité Déficit en hétérozygote F= Ht = fréquence théorique d’hétérozygotes Ho = fréquence observée d’hétérozygotes La migration Modèle île – continent Puit – source Le taux de migration (m) est constant. La population du continent est considérée comme étant à l’équilibre. Un locus diallélique. Génération n+1 pi,n+1= (1-m)pi,n + m pc Δp = pi,n+1 - pi,n =mpc –mpi,n = m(pi – pi,n) A l’équilibre Δp=0 m(pc – pi,e) = 0 pi,e = pe Ecart de fréquence En En= pc,n – pi,n En+1= pc,n+1 - pi,n+1 = pc – [(1-m)pi,n + mpc] = pc – mpc – [(1-m)pi,n] = pc (1-m) – [(1-m)Pi,n] En+1 = (1-m) (pc – pi,n) En+1 = (1-m)En En+x = pc – pi,n+x = (1-m)x En Structure des populations 2 pop p1 et p2 haploïdes, n’ont pas le même contenu génétique p1 (allèles A et B) p2 (allèles A et C) Brassage. Il y aura panmixie quand m = 0,5. Effet wahlund Indices de fixation de Wright HI = hétérozygotie moyenne par individu dans une sous population HS = Hétérozygotie attendue par l’individu dans une sous-population (HW) HT = Hétérozygotie moyenne attendue dans la population entière (HW) FIS= (HS et HI moyens) FST = (HS moyen) Effet Wahlund FST = m = taux de migration Ne = effet efficace Loci diploïdes. Modèle de migration « en îles » Dérive génétique Gamètes zygotes A,a AA Aa aa P,q p’≠ p ; q’≠q Fixation 2N allèles dans la population. Loi binomiale A, P proba de tiré n allèles A parmi 2N allèles au total. P(n) = pnq2N-n Po = ¾ 2N = 80 gamètes en G1 N= 60 nombre de A pour p1= ¾ P(60) = p60q80-60= * ¾ 60* ¼ 20 = 0,103 Population 2N = 4 (2 individus diploïdes) Po= ½ \classe P=0 0/2N P= ¼ 1/2N P= ½ 2/2N P= ¾ 3/2N Go 1 G1 0,0625 0,25 0,375 0,25 G2 0,166 0,210 0,246 0,210 G3 0,249 0,160 0,181 0,160 G4 0,311 0,120 0,135 0,120 G8 0,440 0,038 0,044 0,038 N=16 individus Ne = 12 individus Effectif efficace : Sert à mesurer la force de la dérive dans la population Sexes séparés Nm + Nf = N Effectif variable Ni à la génération i Ne = = *x P=1 4/2N 0,0625 0,166 0,249 0,311 0,440 P moyen 0,5 0,5 0,5 0,5 0,5 0,5 Goulot d’étranglement (bottleneck) diminution du nombre d’individus d’une génération sur l’autre. Effet de dérive très fort. Perte très rapide du polymorphisme. La petite taille fait en plus augmenter la consanguinité. On a donc fixé des allèles délétères à l’état hétérozygote. Effet fondateur : quelques individus vont migrer et vont former une nouvelle population. Il va falloir un certain nombre de migration pour que la diversité génétique revienne. Une métapopulation est un groupe de populations d'individus d'une même espèce, séparées spatialement (ou temporellement) et qui réagissent réciproquement à un niveau quelconque. Ex : le thym de notre arrière pays ! L’augmentation de la consanguinité dans une population de petite taille : on a donc fixé des allèles délétères à l’état hétérozygote. Le coefficient de consanguinité moyen augmente à chaque génération. Sur le contenu génétique : absence de panmixie. Conséquences : ne fait pas perdre les allèles, mais les fréquences génotypiques des hétérozygotes vont changer et la perte d’allèle sera plus rapide. Si une population de petite taille reçoit des migrants, cela empêche l’augmentation d’autofécondité et rend la dérive plus difficile. La génétique de la conservation : L’érosion génétique se manifeste dans le cas d’espèces introduites qui entrent en compétition avec des variétés ou des races sauvages. Aa µ A>a si h=0 ; Δp = Δpmut + Δpsél A l’équilibre Δpmut + Δpsél = 0 Δpsél=Δpmut q est négligeable devant 1. qe = µ/S lorsque h=1 qe= si h=0 a<A si h=1