AgroParisTech 1 année 2016-2017, Tronc commun Bloc SVM TD

AgroParisTech 1
ère
année 2016-2017, Tronc commun Bloc SVM
TD Génétique Quantitative Séance n°1
https://tice.agroparistech.fr/coursenligne/user_portal.php
Étude de la variabilité génétique du poids moyen d’un grain dans une population de
lignées recombinantes chez Phaseolus vulgaris
I. Introduction
En 1923, dans une population F2 de haricots, Karl Sax a mis en évidence une association entre un caractère
qualitatif (couleur de la graine, blanc/coloré brun) et un caractère quantitatif (poids de la graine). Ce travail
est à l’origine de l’idée d’utiliser des marqueurs (caractères monogéniques à disjonction mendélienne) pour
localiser sur le génome des gènes impliqués dans la variation des caractères quantitatifs (QTL : Quantitative
Trait Loci).
Le caractère de pigmentation des graines est gouverné par un locus à 2 allèles. L’allèle coloré est dominant.
On trouve donc les proportions suivantes : ¼ de [blanc] et ¾ de [coloré] dans une population F2 et ½ de
[blanc] et ½ de [coloré] dans une population de lignées recombinantes.
Schéma d’obtention des lignées recombinantes
A partir du croisement entre deux lignées pures de haricot, les lignées recombinantes sont obtenues par
autofécondations successives à partir des graines F2 :
Les données disponibles pour le TD ont été recueillies sur 100 lignées recombinantes (F6). 5 gousses ont été
récoltées sur chacune des lignées et pour chaque gousse le poids moyen d’un grain exprimé en
centigrammes a été mesuré. L’ensemble des données recueillies (500 valeurs de poids moyens d’un grain)
sont dans le tableau excel « lignees_haricots_etudiants.xls ».
On observe dans la population de lignées recombinantes, une ségrégation pour la couleur des graines et une
forte variation pour leur poids. On cherche à répondre aux questions suivantes :
- Y-a-t’il un déterminisme génétique du poids moyen d’une graine ?
- Existe-t-il une liaison entre la couleur des graines et leur poids. Si oui, comment l’interpréter?
II. Estimation de la variabilité génétique du poids des graines
On s’intéresse au poids moyen d’une graine d’une gousse de haricot dans la population de lignées
recombinantes (issues d’un croisement entre deux lignées pures, Koba et Lydia), les deux sources de
variation sont :
les différences génétiques entre lignées (variabilité inter-lignées)
la variation résiduelle entre gousses d’une même lignée (variabilité intra-lignée) comprenant à la
fois des effets du milieu et des erreurs de mesure
II.1. Décomposition de la variabilité phénotypique pour le poids moyen d’une graine dans la
population de lignées recombinantes de haricot : (feuille excel « Don TP 100 lignées »)
On utilise le modèle linéaire suivant pour décomposer la valeur phénotypique P
ij
mesurée sur la gousse j de
la lignée i :
P
ij
=µ
i
+ε
ij
= µ + G
i
+ ε
ij
i=1..I, I=100 est l’indice de la lignée
j=1..J, J=5 est l’indice de la répétition (ici, une gousse)
µ est le poids moyen d’une graine dans la population de lignées recombinantes
G
i
est l’effet génétique moyen de la lignée i. Attention, ici, les lignées recombinantes ont été
tirées au hasard parmi l’ensemble des lignées recombinantes qu’il eut été possible d’obtenir
à partir du croisement initial. Les Gi sont donc des variables aléatoires indépendantes,
d’espérance nulle (E(G
i
)=0), et de variance Var(G
i
)=σ
2G
.
ε
ij
est l’effet résiduel. Par construction du modèle, E(εij)=0. On appelle σ
2E
=Var(ε
ij
) la variance
résiduelle. Le plan d’expérience utilisé permet de faire l’hypothèse que les ε
ij
sont des
variables aléatoires indépendantes.
P
ij
les P
ij
sont des variables aléatoires indépendantes d’espérance E(P
ij
)=µ et de variance
σ
2
(P
ij
)=σ
2P
Ce modèle de décomposition de la valeur phénotypique en une somme de variables aléatoires indépendantes
permet d’écrire : σ
2P
= σ
2G
+ σ
2E
Estimation des paramètres du modèle
Avec ce modèle, les paramètres à estimer sont les suivants : µ, σ
2E
, σ
2G
Estimation de la moyenne µ:
..
ˆ
P
=
µ
, moyenne de toutes les valeurs. Dans notre cas, moyenne des IJ=500 valeurs
Estimation de la variance environnementale σ
2E
:
∑ ∑ == =
=
=
I
ii
I
i
J
jiijE
s
I
PP
JI
S
1
2
1 1
2
.
2
1
)(
1
11
où s
2i
est une estimation de la variance résiduelle dans l’échantillon des 5 gousses de la
lignée i.
Estimation de la variance génétique de la population σ
2G
Variance entre les moyennes des lignées
Pour estimer la variance génétique de la population, on calcule σ
2
(P
i.
), qui est la variance entre les moyennes
estimées des lignées. La moyenne P
i
. de la lignée i dans l’échantillon est une variable aléatoire, qui s’écrit,
en utilisant le modèle défini plus haut :
.
.
ii
GPi
εµ
++=
et peut donc se décomposer comme la somme de deux variables aléatoires, G
i
et ε
i.
ε
i.
est la moyenne de l’effet résiduel dans l’échantillon de gousses de la lignée i
On a donc : E(ε
i.
) = 0 et σ
2
(ε
i.
)= σ
2E
/J
D’où
( ) ( ) ( )
22
.
222
.
2
1
)(
EGiii
J
GP
σσεσσµσσ
+=++= (car µ est une constante de variance nulle)
Estimation de
σ
2
(P
i.
)
L’estimateur de σ
2
(P
i.
) est :
( )
=
=
I
iii
PP
I
PS
1
2
....
2
1
1
)(
Estimation de la variance génétique :
On en déduit un estimateur de la variance génétique de la population :
2
.
22
1
)(
EiG
S
J
PSS =
Calculs à réaliser :
Calculer les 100 variances S
2i
, en déduire l’estimation de
σ
2E
Calculer S
2
(Pi.)
Estimer
σ
2G
,
2
2
2
P
G
SL
S
S
h=
et
)(
.
.
2
2
2
i
G
PS
S
Pi
h=
2. Relation entre la couleur des graines et leur poids moyen dans la population de lignées
recombinantes : feuille excel «Don triées couleur »
Nous venons de montrer qu’une part importante de la variation entre lignées pour le poids moyen
d’une graine pouvait être attribuée à des différences génétiques entre lignées, nous allons maintenant
nous intéresser à la relation entre la couleur des graines et leur poids. On rappelle que l’un des
parents du croisement possède de petites graines blanches, et l’autre, de grosses graines colorées.
D’autre part, nous savons que la coloration des graines est gouvernée par un locus, l’allèle C
conduisant au phénotype « graine pigmentée » étant dominant sur l’allèle c conduisant au phénotype
« graine blanche ».
Nous allons poursuivre l’expérience de Karl Sax et tester si l’on retrouve bien parmi les 100 lignées une
association entre la couleur et le poids d’une graine.
a) Mise en évidence d’un effet de la pigmentation des graines sur leur poids (feuille « Don
Triées Couleur »)
En séparant les lignées en deux groupes, selon la couleur des graines, et en utilisant les valeurs
phénotypiques moyennes de chaque lignée, on peut facilement estimer la moyenne de chaque classe
et, ainsi que les variances résiduelles intra-classe, et.
Calculer sous excel (feuille « Don Triées Couleur ») les effectifs, moyennes et variances
correspondant aux 6 valeurs définies dans le tableau ci-dessous.
Génotype cc = Blanc CC
= Coloré
Effectif N
B
N
C
Moyenne m
B
m
C
Variance résiduelle intra-
classe S
2B
S
2C
Que peut-on en conclure ?
Quels phénomènes biologiques peut-on évoquer pour expliquer cette liaison ?
b) La feuille excel « Distributions » permet de visualiser :
-la distribution (unimodale continue, ~normale) des 500 valeurs phénotypiques (Pij), de variance
(
σ
2
Pij
=
σ
2G
+
σ
2E
)
-la distribution des 100 moyennes (Pi.) dont la dispersion est légèrement réduite comparée à la
dispersion des valeurs phénotypiques (
σ
2
Pi.
=
σ
2G
+
σ
2E
/5). La réduction de dispersion est faible car,
dans l’exemple traité, la part de variance environnementale est minoritaire dans la variation
phénotypique (H2= 0,697 =>
σ
2E
/σ
2
P
= 0.303)
-la distribution des 41 lignées à grains blancs et celle des 59 lignées à grains colorés. Ces deux
distributions ne sont pas centrées sur la même moyenne, mais la différence n’est pas suffisante pour
être repérée quand on observe la distribution des 100 lignées. Seule la liaison avec le marqueur
« couleur » et un test statistique permet de repérer un QTL(*).
(*) QTL pour Quantitative Trait Locus, (ici région chromosomique) dont la variation allélique est impliquée dans la
variation d’un caractère quantitatif.
1 / 4 100%