Dérive génétique (genetic drift) 1. La dérive aléatoire des fréquences alléliques Fluctuation de la fréquence de l’allèle Brown dans K tubes de Drosophiles de 16 individus pendant 19 générations. Fréquence initiale : pt0 = 0,5 À chaque génération, pour une lignée donnée: Au cours des générations, la distribution s’étale, puis la fréquence atteint les valeurs de fixation (0 et 1) dans quelques lignées. Le polymorphisme est perdu. La fréquence moyenne des deux allèles reste approximativement égale à la fréquence de départ : 0,50 Lancer Populus Ce n’est qu’après l’utilisation des alloenzymes en génétique des populations qu’il a été possible d’étudier de façon systématique la dérive génétique dans de nombreuses espèces, de façon reproductible. Auparavant, les systèmes derencontre, type « coquille des escargots« ne permettaient pas de généralisations Exemple de données récoltées dans les années 1970-1980 sur le polymorphisme polypeptidique des enzymes du métabolisme général chez de nombreux organismes La migration d’une protéine soluble dans un champ électrique (gel de polyacrylamide ou d’amidon) ne révèle pas toutes les substitutions d’acides aminés Elle ne permet pas non plus de révéler toutes les substitutions nucléotidiques Les protéines ont un grand rôle fonctionnel: les changements d’acides aminés peuvent affecter l’adaptation de l’organisme: ils ne sont pas neutres. La distance de migration ne nous dit pas la distance génétique, ou l’apparentement, entre les allèles. On a appelé ce type de données Modèle à nombre infini d’allèles Infinite allele model (IAM) Dérive génétique (genetic drift) 2. La coalescence des lignées ancestrales Lors de la reproduction, il y a deux sources de hasard : (1) La loterie mendélienne : chaque gamète est tiré d’un tirage avec relise des gènes du parent (2) La loterie sur la taille des familles (= nombre d’adultes reproducteurs survivants parmi les descendants) Cas 1 : Perte de lignées génétiques dans la descendance d’un couple, si le nombre de descendant est de variance 0 avec 2 enfants P = ½ ½ = ¼ = 0,25 avec 3 enfants, P = ½ ½ ½ = 0,125 Cas 1+ cas 2 = Probabilité qu’un gène ne soit pas transmis à la génération suivante dans une population de taille fixe N N 1 1 N p = 1 − ≈ exp − = e −1 = = 0,367 N e N 1 p = 1 − 2N Avec 1 1 − 2N 2N 2N ≈ e −1 ≈ 0,367 = 0,367 Que se passe-t-il quand on fait un tirage avec remplacement, en gardant une population constante ? Sous R set.seed(2014) n <-seq (1,100) n {n<-sample(n,replace=T) ; n<-sort(n) ; print(n)} Que se passe-t-il sur 10 générations ? Sous R set.seed(2015) n <-seq (1,100) for (i in 1:10) {n<-sample(n,replace=T) ; n<-sort(n) ; print(n)} Au bout de combien de générations a-t-on épuisé toute variabilité ? Sous R set.seed(2015) n<-seq (1,100); a<-0 ; while (n[1]<n[100]) {n<-sample(n,replace=T) ; n<sort(n);a<-a+1}; (a); Au bout de combien de générations ne reste-t-il que deux lignées ? E<-seq(1,100) n<-seq (1,100); a<-0 ; while (length(E)>2) {n<-sample(n,replace=T) ; n<-sort(n);a<-a+1; E <as.vector(table(n)) }; (a);(n);E Combien de générations en moyenne jusqu’à la perte de variation? Sous R set.seed(2015) m<-0; v<-0;for (i in 1:100) {E<-seq(1,100);n<-seq (1,100); a<-0 ; while (length(E)>1) {n<-sample(n,replace=T) ; n<-sort(n);a<-a+1; E <as.vector(table(n)) }; print (a); m<-(m+a); v=(v+a^2)} m; i; (m/i); sqrt(v/i-(m/i)^2) set.seed (1859) PROBA<-0.001 DONNEES<-rexp(1000,PROBA) # DONNEES MAX<-ceiling(max(DONNEES)) HS<-seq(0,MAX,MAX/100) par(mfrow=c(1,1)) hist (DONNEES, HS, col= “green”, main = “”) legend (locator (1), c( title = "Distribution exponentielle", " ", paste (“probabilité =“, PROBA), paste (“moyenne =“, (signif(mean(DONNEES),5))), paste(“médiane =“, (signif(median(DONNEES),5))), paste(“variance =“, (signif(var(DONNEES),5))), paste(“moyenne au carré =”,(signif(mean(DONNEES)^2,5))) , paste(“maximum =“,( signif(max(DONNEES),5))) )) set.seed (1859) PROBA<-0.001 DONNEES<-rexp(1000,PROBA) # DONNEES MAX<-ceiling(max(DONNEES)) HS<-seq(0,MAX,MAX/100) par(mfrow=c(1,1)) hist (DONNEES, HS, col= ’green’, main = ‘’) legend (locator (1), c( title = ‘Distribution exponentielle’, paste (‘probabilité =‘, PROBA), paste (‘moyenne =‘, (signif(mean(DONNEES),5))), paste(‘médiane =‘, (signif(median(DONNEES),5))), paste(‘variance =‘, (signif(var(DONNEES),5))), paste(‘moyenne au carré =’,(signif(mean(DONNEES)^2,5))) , paste(‘maximum =‘,( signif(max(DONNEES),5))) )) 70 10 20 30 40 50 probabilité = 0.001 moyenne = 1059.1 médiane = 782.47 variance = 968500 moyenne au carré = 1121700 maximum = 8078.4 0 Frequency 60 Distribution exponentielle 0 2000 4000 DONNEES 6000 8000 On appelle population de Wright-Fisher une population dont les gènes sont exclusivement transmis au hasard d’une génération à l’autre. NB. La transmission de chaque gène suit une loi de Poisson, le modèle sélectif est neutre, la taille de la population est constante. Autosomes 2Ne Chromosome X 1,5Ne Mitochondries 0,5 Ne Chromosome Y 0,5 Ne On appelle effectif efficace d’une population donnée la taille qui donnerait la même perte de diversité par génération dans une population e Wright-Fisher. On symbolise l’effectif efficace par Ne Individus hermaphrodites et autogames 1 H t = H 0 ∏i =0 1 − 2 Ni t −1 Individus à sexes séparés 1 t −1 1 − i =0 2N i + 1 Ht = H0∏ Il existe plusieurs moyens d'estimer l'effectif efficace lorsqu'on connaît l'écoétholofgie ou la dynbamique des populations de l'espèce étudiée. - Si la population fluctue régulièrement (ex. cycle annuel), l'effectif efficace est la moyenne harmonique des valeurs successives, la formule (2) devient 1 1 t 1 = ∑ N e t i =1 N i σ 2k - Si l'espérance du nombre de descendants varie, avec Ne = : variance du nombre de gènes transmis par parents, on démontre : N σ k2 On note qu'en cas de distribution binomiale, si l'espérance est de 1, la variance est celle d'une loi de Poisson et l'on obtient Ne = N. - Si le sex-ratio n'est pas de 1/1. avec respectivement Nf effectif des femelles, et Nm effectif des mâles, on a, dans le cas d'un gène autosomal 4N m N f 1 1 1 d'où Ne = = + Nm + N f Ne 4N m 4N f Formule que l'on peut chercher à retrouver en s'aidant du schéma ci-joint ensemble des femelles ensemble des mâles On note que si le sex-ratio est de 1/1, alors 2Ne = 2N - Dans le cas d'un gène porté par le chromosome X, on obtient de même I On note que si le sex-ratio est de 1/1, alors 2Ne = 1,5 N Ne = 9N m N f 2N m + 4N f NB. Si la variance sur la taille des familles est de 9, on démontre la relation : Ne = 2 N Ce qui ne veut pas dire que la population augmente ! (Cf. l’exemple des familles de 2 enfants) Cela veut dire que sa perte de variation à chaque génération est diminuée. Cette relation est utile en biologie de la conservation Tableau . Nombre d'individus relachés et variabilité des populations à Tahiti et à Hawaii. D'après Planes et Lecaillon, 1998. Suite à un événement de réensemencement des populations par l’administration américaine, ils étudient le polymorphisme électrophorétique des enzymes (allozymes) dans la populati n de départ et la population d’arrivée (on suppose que les valeurs trouvées sont les valeurs vraie Lutjanus kasmira Cephalopholis argus Effectif relâché N Tahiti H0 Hawaii HT Cephalopholis argus 571 0.046 0.0447 Lutjanus kasmira 2435 0.0853 0.0819 Espèce On peut appliquer la formule : Lutjanus kasmira 1 H t = H 0 ∏i =0 1 − 2 Ni t −1 Cephalopholis argus Effectif relâché N Tahiti H0 Hawaii HT Effectif fondateur Ne Cephalopholis argus 571 0.046 0.0447 17 Lutjanus kasmira 2435 0.0853 0.0819 12 Espèce La tyrosynémie héréditaire est une maladie génétique autosomale récessive monofactorielle (= due à un seul locus). Elle affecte une personne sur 100.000 dans la populations humaine Question 1. Quelle est la fréquence q de l’allèle responsable de la maladie dans la population humaine ? Au Saguenay-Lac Saint-Jean (Québec) suite à un effet fondateur, la fréquence de l’allèle est différente. Une personne sur 1846 est affectée. Question 2. Quelle est la fréquence q dans la population du Saguenay-Lac SaintJean? Notion de goulot d’étranglement populationnel (bottleneck) Notion de population fondatrice (founding effect) Exemple librement inspiré du manuel de génétique des population de James Crow 1789: les marins de la HMS Bounty se mutinent contre le capitaine Bligh, vont chercher des épouses à Tahiti et fondent une colonie anglo-tahitienne clandestine sur l’île de Pitcairn. Soit N = 10 fondateurs (5 hommes, 5 femmes) Quelle est la perte de variabilité (en pourcentage) après 7 générations si la population reste constante ? Soit N = 10 fondateurs (5 hommes, 5 femmes) Quelle est la perte de variabilité (en pourcentage) après 7 générations si la population double à chaque génération ? Au bout de combien de générations la variation serat-elle réduite de 50 % ? de 80% ? de 90% ? En supposant N constant Variation moléculaire (π x 1000) dans 6 populations humaines Population Autosomes Chromosomes X Mandenka 1,20 0,99 Biaka 1,21 0,95 San 1,26 0,85 Han 0,81 0,58 Basques 0,87 0,71 Mélanésiens 0,78 0,66 La diversité moléculaire (π) peut se définir de deux manières différentes : - c’est l’hétérozygotie moyenne à chaque site nucléotidique - C’est le nombre moyen de différences entre séquences prises deux à deux dans une populations, divisé par la longueur du gène F-statistics Notion de FST Que se passe-t-il quand on mélange deux populations ? * La fréquence du mélange est égale à la moyenne des fréquences alléliques * La fréquence des hétérozygotes du mélange est toujours inférieure à la fréquence attendue des hétérozygotes qj qi qk Population structurée Nous avons vu l’effet de dérive, par laquelle la partie est toujours moins variable que le tout Nous allons voir l’effet Wahlund, par lequel les parties sont toujours moins variables que leur somme qj qi qk 3. Depuis les années 1990, la génomique des populations … Structure de population de 1048 humains à partir de 993 marqueurs génétique. Chaque individu est représenté par une ligne verticale, partitionnée en K segments colorés. Les traits noirs séparent les populations. La valeur de K indique combien de groupes (clusters) le logiciel STRUCTURE a estimé. Modèle d’isolement par la distance Phylogénie en étoile Les populations n’échangent plus de migrants et accumulent les différences Modèle en île Par la migration, un équilibre s’établit entre différenciation et ressemblance Isolement par la distance Les populations échangent de migrants de proche en proche, la différentiation s’accroit avec la distance