Document

publicité
Dérive génétique
(genetic drift)
1. La dérive aléatoire des fréquences alléliques
Fluctuation de la fréquence de
l’allèle Brown dans K tubes de
Drosophiles de 16 individus
pendant 19 générations.
Fréquence initiale : pt0 = 0,5
À chaque génération, pour
une lignée donnée:
Au cours des générations, la distribution s’étale, puis la fréquence
atteint les valeurs de fixation (0 et 1) dans quelques lignées. Le
polymorphisme est perdu.
La fréquence moyenne des deux allèles reste approximativement
égale à la fréquence de départ : 0,50
Lancer Populus
Ce n’est qu’après l’utilisation des alloenzymes en génétique des populations qu’il a
été possible d’étudier de façon systématique la dérive génétique dans de
nombreuses espèces, de façon reproductible.
Auparavant, les systèmes derencontre, type « coquille des escargots« ne
permettaient pas de généralisations
Exemple de données récoltées dans les années 1970-1980 sur le polymorphisme
polypeptidique des enzymes du métabolisme général chez de nombreux organismes
La migration d’une protéine soluble dans un champ électrique (gel de
polyacrylamide ou d’amidon) ne révèle pas toutes les substitutions d’acides aminés
Elle ne permet pas non plus de révéler toutes les substitutions nucléotidiques
Les protéines ont un grand rôle fonctionnel: les changements d’acides aminés
peuvent affecter l’adaptation de l’organisme: ils ne sont pas neutres.
La distance de migration ne nous dit pas la distance génétique, ou
l’apparentement, entre les allèles. On a appelé ce type de données
Modèle à nombre infini d’allèles
Infinite allele model (IAM)
Dérive génétique
(genetic drift)
2. La coalescence des lignées ancestrales
Lors de la reproduction, il y a deux sources de hasard :
(1) La loterie mendélienne : chaque gamète est tiré d’un
tirage avec relise des gènes du parent
(2) La loterie sur la taille des familles (= nombre d’adultes
reproducteurs survivants parmi les descendants)
Cas 1 : Perte de lignées génétiques dans la descendance
d’un couple, si le nombre de descendant est de variance 0
avec 2 enfants
P = ½ ½ = ¼ = 0,25
avec 3 enfants,
P = ½ ½ ½ = 0,125
Cas 1+ cas 2 = Probabilité qu’un gène ne soit pas
transmis à la génération suivante dans une population de
taille fixe N
N
1
1
 N

p = 1 −  ≈ exp −  = e −1 = = 0,367
N
e
 N

1 

p = 1 −

2N 

Avec
1 

1 −

2N 

2N
2N
≈ e −1
≈ 0,367
= 0,367
Que se passe-t-il quand on fait un tirage avec remplacement, en
gardant une population constante ?
Sous R
set.seed(2014)
n <-seq (1,100)
n
{n<-sample(n,replace=T) ; n<-sort(n) ; print(n)}
Que se passe-t-il sur 10 générations ?
Sous R
set.seed(2015)
n <-seq (1,100)
for (i in 1:10) {n<-sample(n,replace=T) ; n<-sort(n) ; print(n)}
Au bout de combien de générations a-t-on épuisé toute variabilité ?
Sous R
set.seed(2015)
n<-seq (1,100); a<-0 ; while (n[1]<n[100]) {n<-sample(n,replace=T) ; n<sort(n);a<-a+1}; (a);
Au bout de combien de générations ne reste-t-il que deux lignées ?
E<-seq(1,100)
n<-seq (1,100); a<-0 ;
while (length(E)>2) {n<-sample(n,replace=T) ; n<-sort(n);a<-a+1; E <as.vector(table(n)) }; (a);(n);E
Combien de générations en moyenne jusqu’à la perte de variation?
Sous R
set.seed(2015)
m<-0; v<-0;for (i in 1:100) {E<-seq(1,100);n<-seq (1,100); a<-0 ; while
(length(E)>1) {n<-sample(n,replace=T) ; n<-sort(n);a<-a+1; E <as.vector(table(n)) }; print (a); m<-(m+a); v=(v+a^2)}
m; i; (m/i); sqrt(v/i-(m/i)^2)
set.seed (1859)
PROBA<-0.001
DONNEES<-rexp(1000,PROBA)
# DONNEES
MAX<-ceiling(max(DONNEES))
HS<-seq(0,MAX,MAX/100)
par(mfrow=c(1,1))
hist (DONNEES, HS, col= “green”, main = “”)
legend (locator (1), c(
title = "Distribution exponentielle",
" ",
paste (“probabilité =“, PROBA),
paste (“moyenne =“, (signif(mean(DONNEES),5))),
paste(“médiane =“, (signif(median(DONNEES),5))),
paste(“variance =“, (signif(var(DONNEES),5))),
paste(“moyenne au carré =”,(signif(mean(DONNEES)^2,5))) ,
paste(“maximum =“,( signif(max(DONNEES),5))) ))
set.seed (1859)
PROBA<-0.001
DONNEES<-rexp(1000,PROBA)
# DONNEES
MAX<-ceiling(max(DONNEES))
HS<-seq(0,MAX,MAX/100)
par(mfrow=c(1,1))
hist (DONNEES, HS, col= ’green’, main = ‘’)
legend (locator (1), c(
title = ‘Distribution exponentielle’,
paste (‘probabilité =‘, PROBA),
paste (‘moyenne =‘, (signif(mean(DONNEES),5))),
paste(‘médiane =‘, (signif(median(DONNEES),5))),
paste(‘variance =‘, (signif(var(DONNEES),5))),
paste(‘moyenne au carré =’,(signif(mean(DONNEES)^2,5))) ,
paste(‘maximum =‘,( signif(max(DONNEES),5))) ))
70
10
20
30
40
50
probabilité = 0.001
moyenne = 1059.1
médiane = 782.47
variance = 968500
moyenne au carré = 1121700
maximum = 8078.4
0
Frequency
60
Distribution exponentielle
0
2000
4000
DONNEES
6000
8000
On appelle population de Wright-Fisher une population dont les gènes
sont exclusivement transmis au hasard d’une génération à l’autre.
NB. La transmission de chaque gène suit une loi de Poisson, le modèle
sélectif est neutre, la taille de la population est constante.
Autosomes
2Ne
Chromosome X 1,5Ne
Mitochondries
0,5 Ne
Chromosome Y 0,5 Ne
On appelle effectif efficace d’une population donnée la taille qui
donnerait la même perte de diversité par génération dans une population e
Wright-Fisher. On symbolise l’effectif efficace par Ne
Individus hermaphrodites et autogames

1 

H t = H 0 ∏i =0 1 −

 2 Ni 
t −1
Individus à sexes séparés
1 
t −1 
1 −

i =0 
 2N i + 1
Ht = H0∏
Il existe plusieurs moyens d'estimer l'effectif efficace lorsqu'on connaît
l'écoétholofgie ou la dynbamique des populations de l'espèce étudiée.
- Si la population fluctue régulièrement (ex. cycle annuel), l'effectif efficace est la
moyenne harmonique des valeurs successives, la formule (2) devient
1 1 t 1
= ∑
N e t i =1 N i
σ 2k
- Si l'espérance du nombre de descendants varie, avec
Ne =
: variance du nombre de gènes transmis par parents, on démontre :
N
σ k2
On note qu'en cas de distribution binomiale, si l'espérance est de 1, la variance est celle d'une loi de Poisson et l'on obtient
Ne = N.
- Si le sex-ratio n'est pas de 1/1. avec respectivement Nf effectif des femelles, et Nm effectif des mâles, on a, dans le cas
d'un gène autosomal
4N m N f
1
1
1
d'où
Ne =
=
+
Nm + N f
Ne 4N m 4N f
Formule que l'on peut chercher à retrouver en s'aidant du schéma ci-joint
ensemble
des femelles
ensemble
des mâles
On note que si le sex-ratio est de 1/1, alors 2Ne = 2N
- Dans le cas d'un gène porté par le chromosome X, on obtient de même
I
On note que si le sex-ratio est de 1/1, alors 2Ne = 1,5 N
Ne =
9N m N f
2N m + 4N f
NB. Si la variance sur la taille des familles est de 9, on
démontre la relation :
Ne = 2 N
Ce qui ne veut pas dire que la population augmente !
(Cf. l’exemple des familles de 2 enfants)
Cela veut dire que sa perte de variation à chaque
génération est diminuée.
Cette relation est utile en biologie de la conservation
Tableau . Nombre d'individus relachés et variabilité des populations à Tahiti et à
Hawaii. D'après Planes et Lecaillon, 1998.
Suite à un événement de réensemencement des populations par l’administration
américaine, ils étudient le polymorphisme électrophorétique des enzymes
(allozymes) dans la populati n de départ et la population d’arrivée
(on suppose que les valeurs trouvées sont les valeurs vraie
Lutjanus kasmira
Cephalopholis argus
Effectif
relâché N
Tahiti
H0
Hawaii
HT
Cephalopholis argus
571
0.046
0.0447
Lutjanus kasmira
2435
0.0853
0.0819
Espèce
On peut appliquer la formule :
Lutjanus kasmira

1 

H t = H 0 ∏i =0 1 −
 2 Ni 
t −1
Cephalopholis argus
Effectif
relâché N
Tahiti
H0
Hawaii
HT
Effectif
fondateur Ne
Cephalopholis argus
571
0.046
0.0447
17
Lutjanus kasmira
2435
0.0853
0.0819
12
Espèce
La tyrosynémie héréditaire est une maladie génétique autosomale récessive
monofactorielle (= due à un seul locus).
Elle affecte une personne sur 100.000 dans la populations humaine
Question 1. Quelle est la fréquence q de l’allèle responsable de la maladie dans la
population humaine ?
Au Saguenay-Lac Saint-Jean (Québec) suite à un effet fondateur, la fréquence de
l’allèle est différente. Une personne sur 1846 est affectée.
Question 2. Quelle est la fréquence q dans la population du Saguenay-Lac SaintJean?
Notion de goulot d’étranglement populationnel
(bottleneck)
Notion de population fondatrice
(founding effect)
Exemple librement inspiré du manuel de génétique des
population de James Crow
1789: les marins de la HMS Bounty se mutinent contre le capitaine Bligh,
vont chercher des épouses à Tahiti et fondent une colonie anglo-tahitienne
clandestine sur l’île de Pitcairn.
Soit N = 10 fondateurs (5 hommes, 5 femmes)
Quelle est la perte de variabilité (en pourcentage) après 7
générations si la population reste constante ?
Soit N = 10 fondateurs (5 hommes, 5 femmes)
Quelle est la perte de variabilité (en pourcentage) après 7
générations si la population double à chaque génération ?
Au bout de
combien de
générations la
variation serat-elle réduite
de 50 % ?
de 80% ?
de 90% ?
En supposant
N constant
Variation moléculaire (π x 1000) dans 6 populations humaines
Population
Autosomes
Chromosomes X
Mandenka
1,20
0,99
Biaka
1,21
0,95
San
1,26
0,85
Han
0,81
0,58
Basques
0,87
0,71
Mélanésiens
0,78
0,66
La diversité moléculaire (π) peut se définir de deux manières
différentes :
- c’est l’hétérozygotie moyenne à chaque site nucléotidique
- C’est le nombre moyen de différences entre séquences prises
deux à deux dans une populations, divisé par la longueur du gène
F-statistics
Notion de FST
Que se passe-t-il quand on mélange deux populations ?
* La fréquence du mélange est égale à la moyenne des fréquences
alléliques
* La fréquence des hétérozygotes du mélange est toujours inférieure
à la fréquence attendue des hétérozygotes
qj
qi
qk
Population structurée
Nous avons vu l’effet de dérive, par laquelle
la partie est toujours moins variable que le tout
Nous allons voir l’effet Wahlund, par lequel
les parties sont toujours moins variables que leur somme
qj
qi
qk
3. Depuis les années 1990, la génomique des populations …
Structure de population de 1048 humains à partir de 993 marqueurs génétique.
Chaque individu est représenté par une ligne verticale, partitionnée en K segments
colorés. Les traits noirs séparent les populations. La valeur de K indique combien de
groupes (clusters) le logiciel STRUCTURE a estimé.
Modèle d’isolement par la distance
Phylogénie en étoile
Les populations n’échangent plus de
migrants et accumulent les différences
Modèle en île
Par la migration, un équilibre s’établit
entre différenciation et ressemblance
Isolement par la distance
Les populations échangent de migrants de proche en
proche, la différentiation s’accroit avec la distance
Téléchargement