La génétique des populations La génétique des populations La

publicité
10/09/15
La génétique des populations
La génétique des populations
DEFINITIONS:
Génétique des populations: Etudier la variation, d'une génération à
l'autre, des fréquences des gènes dans les populations.
• Gène : unité d'information biologique, transmise au cours des générations,
codant pour une fonction. Correspond à une séquence d'une macromolécule
(ADN ou ARN) transmise, transcrite et généralement traduite par un
système biochimique, ce qui permet l'expression d'une activité biologique.
La base:
J.P. Henry, P.H. Gouyon. 2008. Précis de génétique des populations
Ed: Dunod (20€)
• Locus : historiquement, position du gène sur le chromosome. En génétique
des populations, ensemble de gènes homologues (classe d'homologie). Deux
gènes sont homologues s’ils s’apparient à la méiose.
Plus complet:
D.L. Hart & Clark. 2007. Principles of populations genetics.
Ed: Sinauer (98€)
• Gènes allèles : deux gènes homologues sont dits allèles quand ils ont des
formes différentes, distinguables à un niveau d’observation donné. Un
allèle, c’est une classe de gènes homologues qu’on ne distingue pas entre
eux. Un allèle peut correspondre à une seule séquence, ou à un ensemble de
séquences différentes mais non distinguables au niveau du phénotype.
1
La génétique des populations
V
V
V
J
V
J
J
J
La génétique des populations
Constitution phénotypique
Constitution génotypique
Constitution allélique
en fréquence relative
Sous réserve que la variation phénotypique soit
génétiquement déterminée, la variation des fréquences
des phénotypes correspond à une variation sous-jacente
des fréquences des génotypes
V
V
Constitution phénotypique : 4/5 [V] ; 1/5 [J]
Constitution génotypique : 2/5 VV ; 2/5 VJ ; 1/5 JJ
Constitution allélique : 6/10 V ; 4/10 J
2
Génétique des populations : formalisation de l'évolution
des fréquences génotypiques et alléliques sous l'effet de
différentes forces évolutives et des régimes de
reproduction
3
4
1
10/09/15
La génétique des populations
Variation:
* individuelle, intrapopulation
La génétique des populations
Mesures de la variation:
fréquences génotypiques et alléliques
* géographique, interpopulation
et indices plus synthétiques comme
- nombre moyen d’allèles par locus
* génétique ou environnementale
- pourcentage de locus polymorphes
Polymorphisme génétique (variation discontinue):
* morphologique
(à 95%: l’allèle le plus fréquent ne doit pas
dépasser 95 %; à 99%)
* protéique (enzyme)
- hétérozygotie théorique (voir plus loin)
* acides nucléiques (RFLP, microsatelites, séquence, SNP)
* chromosomique
5
1. Structure génétique d’une population
= Les fréquences alléliques et
génotypiques
1. Structure génétique d’une population
N individus diploïdes = 2N gènes au locus considéré
fréquences génotypiques
D = f(AA) = Nb(AA) / N
H = f(Aa) = Nb(Aa) / N
R = f(aa) = Nb(aa) / N
D+H+R=1
1 locus, 2 allèles A et a
N individus haploïdes = N gènes au locus considéré
fréquences génotypiques = fréquences alléliques :
D = f(A) = Nb(A)/N
R = f(a) = Nb(a)/N
p=D
q = 1-p = R
6
fréquences alléliques
p = f(A) =Nb(gènes A) / 2N
q = f(a) = Nb(gènes a) / 2N
p+q = D+R =1
7
p = [2 Nb(AA) + Nb(Aa)] / 2N = D + H/2
q = R + H/2
p+q =1
8
2
10/09/15
1. Structure génétique d’une population
2. Régimes de reproduction
Manière dont les gamètes s’assemblent pour former la
génération suivante.
fréquences génotypiques
fréquences alléliques
fréquences alléliques
fréquences génotypiques ?
2.1. La panmixie
= croisements au hasard des individus ou gamètes pour le
locus étudié
p=q=0,5
AA
0,2
0,4
Aa
0,6
0,2
aa
0,2
0,4
= le fait de connaître le génotype d’un parent ne renseigne
en rien sur le génotype de l’autre parent.
9
2. Régimes de reproduction
10
2. Régimes de reproduction
Modèle de G.H.Hardy et W.Weinberg - 1908
H1: les gamètes s’associent au hasard / gène considéré
H2: la population a une taille infinie donc la fréquence d’un
événement est égale à sa probabilité
H3: la fréquence des gènes n’est pas modifié par la
mutation, la sélection, la migration
Population diploïde, 1 locus avec 2 allèles A et a, de
fréquence p et q.
Mâle
_______
Femelle
A
p
a
q=1-p
A
p
AA
p2
Aa
pq
a
q=1-p
aA
qp
aa
q2
D’où: AA
11
p2
Aa
aa
= structure de
2pq
q2
Hardy-Weinberg
12
3
10/09/15
2. Régimes de reproduction
2. Régimes de reproduction
Test de conformité à la structure de Hardy-Weinberg
p’ = D'+H'/2 = p²+2pq/2 = p²+pq = p(p+q) = p
q’ = R'+H'/2 = q²+pq = q
Donc p et q constantes
Loi de Hardy-Weinberg
* Dans une population isolée, d’effectifs illimités, non
soumise à la sélection et dans laquelle il n’y a pas de
mutation: les fréquences allèliques restent constantes.
* Si les accouplements sont panmictiques, les
fréquences génotypiques se déduisent directement des
fréquences alléliques - elles sont donc aussi
constantes.
€
13
2. Régimes de reproduction
Gn+1
aa
total
effectifs observés
N1
N2
N3
N
effectifs attendus
Np2
N2pq
Nq2
X=
(effectif attendu − effectif observé) 2
effectif attendu
génotypes
X=
(Np 2 − N1 ) 2 (N2 pq − N 2 ) 2 (Nq 2 − N 3 ) 2
+
+
Np 2
N2 pq
Nq 2
p=2N1+N2 / 2N
q=2N3+N2 / 2N
∑
degrés de liberté = nbre de catégories - contraintes
= nbre de catégories - 1 - nbre de paramètres estimés
Voir table du χ2
14
2.2. L’autofécondation ou autogamie totale
AA
Aa
aa
fréquences alléliques?
Dn
Hn
Rn
pn+1 = Dn+1+½ Hn+1 = Dn+¼ Hn +½. ½ Hn = Dn+½ Hn = pn
AA
AA Aa aa
aa
Dn+¼ Hn
Hn+1 = ½ Hn
Aa
2. Régimes de reproduction
2.2. L’autofécondation ou autogamie totale
Gn
AA
½ Hn
donc H tend vers 0
Donc restent constantes.
fréquences génotypiques à l’équilibre? en TD
Rn + ¼ Hn
15
16
4
10/09/15
2. Régimes de reproduction
2. Régimes de reproduction
2.3. Le régime mixte
h2 − h1 = s
s d’autofécondation et (1-s) d’allofécondation
h1 − h0
2
2
h1 = (1 − s )(2 pq ) + s
ht +1 − ht = s
h0
2
h2 = (1 − s )(2 pq ) + s
ht − ht −1 ' s $
= % " (ht −1 − ht − 2 )
2
&2#
t
's$
= ...... = % " (h1 − h0 )
&2#
h1
2
s < 2. Donc ht+1 − ht → 0 quand t → +∞
Donc pour t assez grand, he = cste
17
2. Régimes de reproduction
2. Régimes de reproduction
taux d'hétérozygotes à l'équilibre ?
he = (1 − s )(2 pq ) + s
18
Fis = indice de fixation
défini comme Hobs = 2pq (1-Fis)
he
2
1− Fis =
soit :
' s$
he %1 − " = (1 − s )(2 pq )
& 2#
2(1 − s )
he = 2 pq
2−s
€
19
Fis =
2(1− s)
2−s
s
2−s
20
€
5
10/09/15
2. Régimes de reproduction
Déficit en
hétérozygotes
Fis en fonction de s
Fis =
1
0,8
0,6
0,4
0,2
0
0
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
s, tauxd'autofécondation
2. Régimes de reproduction
s
2−s
EXEMPLE : Medicago truncatula, luzerne annuelle
Marqueurs microsatellites
1
€
Influence du taux d'autofécondation (s), sur la
structure génotypique de la population
But : déterminer le taux d’autofécondation à partir de la
structure génotypique mesurée en pop. nat. (p.ex. avec
21
marqueurs moléculaires)
2. Régimes de reproduction
He = hétérozygotie théorique
EXEMPLE : Medicago truncatula, luzerne annuelle
Locus Allele size (pb)
MTSA5
215
235
239
241
243
245
251
He
Fis
A1
(N=130)
0.688
0.088
0.158
0.027
0.012
0.027
0.495
0.891
A2
(N=125)
0.420
0.016
0.016
0.104
0.444
0.620
0.961
A3
(N=108)
0.028
0.523
0.009
0.426
0.014
0.549
0.933
22
Si deux allèles: 2pq
Aude
0.399
0.193
0.008
0.219
0.010
0.161
0.010
Si plus de deux:
H e = ∑ 2 pi p j = 1− ∑ pi2
i< j
i
2
2
2
H e = 1− p215
− p235
− p239
.....
23
24
6
10/09/15
2. Régimes de reproduction
Le taux d’autofécondation n’est pas
seulement un paramètre du système de
reproduction : il évolue !
EXEMPLE : Medicago truncatula, luzerne annuelle
Locus
MTSA5
MTSA6
MT660252
MT660456
MT660538
Tous locus
He
Fis
He
Fis
He
Fis
He
Fis
He
Fis
He
Fis
1er transect 2ème transect3ème transect
0.495
0.620
0.549
0.891
0.961
0.933
0.379
0.612
0.574
0.848
0.920
0.932
0.060
0.039
0.352
1.000
0.797
0.922
0.366
0.765
0.550
0.979
0.979
0.948
0.440
0.165
0.354
0.913
0.952
0.974
0.348
0.440
0.476
0.910
0.950
0.940
Cyclamen repandum
Cyclamen balearicum
Autofécondation
Réduction florale
25
(diapo : P.O. Cheptou et John Thompson, Cefe-CNRS Montpellier)
26
2. Régimes de reproduction
Une transition fréquente au cours de l’évolution :
de l’allofécondation à l’autofécondation
Exemple : le genre Amsinckia (Boraginaceae)
2.4. Régimes de reproduction fermés
-  autofécondation
-  consanguinité: les unions se font entre apparentés
préférentiellement
conséquences ?
-  homogamie: les unions se font entre individus
qui se ressemblent
“Nevertheless, self-fertilizing species are usually the ends of evolutionary lines and
rarely if ever contributed to major evolutionary trends” (Stebbins, 1974)
(diapo : P.O. Cheptou, Cefe-CNRS Montpellier)
27
conséquences ?
Différence entre les deux ?
28
7
10/09/15
2. Régimes de reproduction
3. Structure génétique des populations
3.1. Description d’une structure de population
quelconque
2.5. Régimes de reproduction ouverts
-  hétérogamie: les unions se font entre individus
phénotypiquement dissemblables
S1
S3
S1 S3
S1 S2
S3 S4
S1 S3
S1 S2
gamétophytique ?
S1 S2
sporophytique avec codominance
aa
fréquences
D
H
R
si panmixie
p2
2pq
q2
sinon:
H = 2pq(1-F)
avec F∈[-1,1]
autres génotypes?
29
3. Structure génétique des populations
3.1. Description d’une structure de population
quelconque
30
3. Structure génétique des populations
3.1. Description d’une structure de population
quelconque
AA
Aa
aa
D
H
R
AA
Aa
aa
?
p2+pqF
2pq(1-F)
q2 +pqF
(1-F)p2 +Fp
(1-F)2pq
(1-F)q2 +Fq
?
H
on a : p = D +
2
Aa
sporophytique avec dominance
Attention: crée de la fréquence dépendance
donc modifie les fréquences alléliques.
fréquences
AA
S3 S4
2pq(1-F)
H
2 pq(1− F)
donc D = p − = p −
= p − pq(1− F)
2
2
D = p(1− q) + pqF = p 2 + pqF
D = p 2 (1− F ) + p 2 F + pqF = p 2 (1− F ) + pF
F
31
système de reproduction ?
32
8
10/09/15
3. Structure génétique des populations
3. Structure génétique des populations
3.2. Populations structurées
3.2. Populations structurées
Il n’est pas toujours évident sur le terrain de reconnaître une population.
Que se passe-il si on a échantillonné sur une zone plus grande qu’une
population panmictique?
Exemple numérique :
population 1 :
population 2 :
p1 q 1
p2 q 2
k
Si chaque pop est à HW :
Aa obs1 = 2*0,2*0,8 = 0,32
Aa obs2 = 2*0,8*0,2 = 0,32
donc en moyenne 0,32 et 0,32 < 0,5
?
Exemple: Une fraction k des individus prise dans une sous-populations 1, et le
reste dans une sous-population 2.
33
34
3. Structure génétique des populations
3. Structure génétique des populations
3.2. Populations structurées
k
3.2. Populations structurées
H att − H obs = .... = 2k(1− k)( p1 − p2 ) 2
p2 q 2
?
>0 si mélange et si
1-k
€
On va observer :
k2 p1q1 + (1− k)2 p2 q2
Sur l’ensemble :
P = kp1 + (1− k) p2
et on s’attend à :
2PQ
hétérozygotes
p1 ≠ p2
EFFET WAHLUND
H obs = H att (1− Fst )
H −H
H
Fst = att € obs = 1− obs
H att
H att
hétérozygotes
€
2
H att − H obs
€ = 2PQ − (k2 p1q1 + (1− k)2 p2 q2 ) = k(1− k)(p1 − p2 )
€
a
q1=0,8
q2=0,2
k = 1-k = 1/2
Sur l'ensemble p=q=0,50, 2pq=0,50
1-k
p1 q 1
A
p1=0,2
p2=0,8
35
FST = paramètre d’écart à la panmixie sur l’ensemble des
populations, dû à l’hétérogénéité des fréquences alléliques
entre populations.
36
9
10/09/15
3. Structure génétique des populations
3. Structure génétique des populations
3.2. Populations structurées
3.2. Populations structurées
Démonstration générale:
H obs = H att (1− Fst )
H − H obs
H
Fst = att
= 1− obs
H att
H att
Soit un locus avec 2 allèles A et a.
Soient n populations panmictiques de fréquences
alléliques pi et qi=1-pi (i=1,..,n).
On suppose n infini
€
Dans chaque population i :
AA
Aa
aa
pi²
2piqi
qi²
E(2piqi)
E(qi²)
En moyenne sur l'ensemble : E(pi²)
FST =
2PQ − 2E ( piqi )
2PQ
€
37
3. Structure génétique des populations
3.2. Populations structurées
FST =
38
3. Structure génétique des populations
3.3. Les F-statistiques
2PQ − 2E ( piqi )
2PQ
F-statistiques
Déficits en hétérozygotes dus aux flux géniques
réduits entre individus et entre populations
différentes
2
E( piqi ) = E ( pi (1− pi )) = E ( pi − pi )
= E( pi ) − E ( pi2 ) = P − E( pi2 )
€
I=individu
S=sous-population
T=totale
2
Or Var( pi ) = E ( pi2 ) − ( E ( pi )) = E ( pi2 ) − P 2
€
€
€
FST =
PQ − P + Var( pi ) + P 2
PQ
HI: hétérozygotie d’un individu dans une sous population
HS: hétérozygotie attendue d’un individu dans une sous population
équivalente en panmixie
2
FST =
€
P(1− P) − P + P + Var( pi ) Var( pi )
=
PQ
PQ
39
HT: hétérozygotie attendue d’un individu dans une population totale
équivalente
40
€
10
10/09/15
3. Structure génétique des populations
3. Structure génétique des populations
3.3. Les F-statistiques
3.2. Populations structurées - les F-statistiques
HI : hétérozygotie d’un individu dans une sous population
HS : hétérozygotie attendue d’un individu dans une sous population
équivalente en panmixie
HT : hétérozygotie attendue d’un individu dans une population totale
équivalente
FIS =
HS − HI
H
= 1− I
HS
HS
i
FIS
= 1−
H iobs
FIS i = 1 −
H i obs
2 piqi
FST = 1 −
2 piqi
2PQ
FIT = 1 −
H obs
2PQ
2 pi qi
2 pi qi
= 1−
2PQ
FST =
HT − H S
H
= 1− S
HT
HT
FST
FIT =
HT − H I
H
= 1− I
HT
HT
FIT = 1−
On a:
(1-FIT) = (1-FIS)(1-FST)
Les F permettent de décrire la structure génotypique d’une
population structurée spatialement en différenciant les effets de cette
structure spatiale et les effets du système reproduction.
H obs
2PQ
41
€
NB: en pratique, pas toujours évident
42
11
Téléchargement