2015 Introduction à la génétique quantitative - Cours 1 Jacques David, & Patrice David
1
Le Modèle Génétique et le cas biallélique
Bibliographie
A. Gallais 1990. théorie de la sélection en amélioration des plantes. Collections Sciences
Agronomiques Masson
Falconer and Mackay Introduction to quantitative genetics, Longman,
4ème
Edition, 1996.
I. Introduction de la notion dhéritabilité, effets génétiques et
environnementaux
La valeur dun pnotype résulte deffets génétiques et environnementaux. La réalité biologique est très
complexe : de nombreux gènes interagissent en réseaux, leurs interactions ne sont pas linéaires et dépendent des
facteurs environnementaux. Pour autant, cette complexité, quasiment inaccessible à une compréhension ou
modélisation exhaustive, nempêche pas, à faut de lexpliquer, de décrire la variation phénotypique
simplement au travers dune approche biométrique. Il suffit que cette molisation (la nétique
quantitative) ait un minimum de portée prédictive au moins à court terme (quelques générations) pour justifier
son intérêt. Si ce modèle peut rendre cause de la ressemblance entre les individus apparentés, il
peut servir à étudier la transmission des caractères.
(a) première étape : centrer le phénotype
Le but de la GQ (génétique quantitative) est dobtenir une approche statistique de la variation du
caractère entre individus dans une population. Ainsi, cette approche ne prédira pas la valeur
absolue dun caractère (« la taille de cet individu est 1.50 cm ») mais raisonnera en termes de
viation par rapport à une référence qui est la moyenne actuelle de cette population (« cet individu
fait 20 cm de moins que la moyenne »). La première étape est donc de « centrer » les mesures de
phénotype en écrivant
Z = µ + P
Z est le phénotype dans son échelle de départ (par exemple la taille 1.50cm) ; µ est le phénotype
moyen de la population (par exemple 1.70 cm) et P le phénotype centré (par exemple -0.20 cm).
Travailler sur P au lieu de Z a plusieurs avantages : (i) éviter de poser des questions qui nont pas de
sens (par exemple : est-ce que la taille de cet individu est 1.50m à cause des gènes ou à cause de
lenvironnement ?; alors que la question «est-ce que untel a une taille inférieure à la moyenne à cause
de ses gènes ou à cause de ses conditions de vie ou les deux ? a un sens)) (ii) La moyenne de P est
par définition zéro, ce qui est très pratique pour les modèles qui suivent...
(b) deuxième étape : décomposer P en effets génétiques et environnementaux
On écrit simplement
P = G + E + GxE
P : le phénotype, G le génotype et E lenvironnement.
Le terme GxE signifie quil y a une interaction entre les gènes et les conditions environnementales,
c'est-à-dire que les effets des différents gènes en présence ne réagissent pas de la même façon aux
conditions de lenvironnement. Cette interaction doit être écrite pour un modèle parfaitement général ;
2015 Introduction à la génétique quantitative - Cours 1 Jacques David, & Patrice David
2
mais dans le reste de ce chapitre, on néglige ces effets (faisant implicitement lhypothèse que le
système se comporte comme si les effets du génotype et ceux de lenvironnement sadditionnaient)
.
Donc
P = G + E
La variance du phénotype (qui mesure sa quantité de variation dans la population) peut sécrire
V(P) = V(G) + V(E) + 2 cov(G,E)
V(P) est la variance phénotypique, V(G) la variance génotypique et cov(G,E) la covariance entre
les deux effets.
Cov(G,E) est non nulle si les effets génétiques et environnementaux ne sont pas statistiquement
indépendants : cest-à-dire si les génotypes ne sont pas distribués aléatoirement entre les
environnements (i.e. si certains génotypes sont plus représentés dans certains environnements). Lors
dexpérimentations contrôlées, cov(G,E) est nulle le plus souvent par construction (on se débrouille
pour répartir aléatoirement la distribution des lignées dans différentes parties du champ par exemple).
De manière plus risquée, on fait souvent cette même supposition pour les populations naturelles.
D :
V(P) = V(G) + V(E)
Lhéritabilité au sens large est alors définie comme
H2 = V(G) / V(P)
Elle correspond donc à la part de variance génotypique sur la variance totale
Elle correspond aussi à la régression qui prédit la valeur génotypique à partir de la valeur
phénotypique
b(G ;P) = cov(P, G)/ V(P)= V(G)/V(P)
Plus lhéritabilité est élevée plus la valeur génotypique est proche de la valeur phénotypique.
(c) régression parent-enfant dans le cas dune reproduction par clonage
Lritabilité au sens large permet de prédire, dans le cas dune reproduction asexuée, le phénotype
dun enfant à partir de celui de son parent (un seul parent en cas de clonage). Le cas de lignées pures
issues dautofécondations répétées est identique à celui du clonage asexué (descendant
génétiquement identique à son unique parent).
Régression parent-enfant (ou Parent-Offspring)
Chaque point représente le phénotype dun parent P et de son enfant O (pour offspring). Le coefficient
de régression b(P
o
, P
p
) est la pente de la droite.
2015 Introduction à la génétique quantitative - Cours 1 Jacques David, & Patrice David
3
PP: phénotype du parent
PO: phénotype du descendant
b(Po,Pp)
PP: phénotype du parent
PO: phénotype du descendant
b(Po,Pp)
Nous avons
b(P
o
, P
p
) = Cov (P
o
, P
p
) / V(P
p
) = Cov (P
o
, P
p
) / V(P)
et
Cov (P
o
, P
p
)= Cov (G
o
+E
o
, G
p
+E
p
) = Cov (G
o
, G
p
)+Cov (E
o
, G
p
)+Cov (G
o
, E
p
)+Cov (E
o
, E
p
)
Cov (G
o
, G
p
) = Cov (G
p
, G
p
) = V(G) car la reproduction par clonage fait que le descendant et le parent
ont le même génotype (G
p
=G
o
)
Cov (E
o
, G
p
) = 0 si le génotype du parent ninfluence pas lenvironnement du descendant ; on suppose
ceci vrai en particulier sil ny a pas deffets maternels forts.
Cov (G
o
, E
p
) = 0 toujours car le génotype du descendant ne peut pas dépendre des conditions de vie
du parent.
Cov (E
o
, E
p
) = 0 (i) sil ny a pas deffets maternels (ii) si le descendant est élevé dans un
environnement qui na rien à voir avec celui de son parent
Moyennant toutes ces conditions on obtient Cov (P
o
, P
p
) = V(G) doù
b(Po, Pp) = V(G) / V(P) = H2 (reproduction clonale ou autofécondation)
II. Dissection de la valeur génétique dans le cas dorganismes sexués
(a) Le modèle génétique
La population considérée est panmictique, son effectif est illimité. On étudie la valeur du
génotype à un locus unique (on suppose donc pour linstant quil ny a quun locus, ayant
éventuellement de nombreux allèles) qui fait varier le caractère. Les allèles en ségrégation dans la
population sont notés Bx et un individu est par exemple noté BiBj (premier allèle dorigine maternelle,
second paternel), avec la possibilique i=j. Soit Gij sa valeur génétique. On décompose Gij dans le
modèle suivant :
2015 Introduction à la génétique quantitative - Cours 1 Jacques David, & Patrice David
4
G
ij= ai + aj + bij
a
i
(a
j
) l'effet aléatoire de l'allèle i (j) auquel on peut associer une variance V(a
i
)=V(a
j
)=V(a) qui reflète
le tirage aléatoire de l'allèle paternel (maternel) dans la population
b
ij
est l'interaction entre les gamètes i et j à laquelle on peut associer une variance V(b
ij
)
Le terme b
ij
doit être ajouté car de manière générale, les allèles i et j ninteragissent pas simplement
de manière additive : par exemple des allèles peuvent être dominants sur d'autres. Si lon ne met pas
le b
ij
on contraint les hétérozygotes BiBj à être exactement intermédiaires entre les homozygotes BiBi
et les BjBj quels que soient i et j.
Par définition dun modèle statistique, nous pouvons contraindre E(a
i
)=E( a
j
) =0 (sachant que nous
avons déjà contraint E(G
ij
)=0) ;
a
i
, (average effect, notation due à Fisher) est par définition la valeur génotypique moyenne des
individus dont l'allèle paternel Bi (et de ceux dont l'allèle maternel est Bi). En labsence de covariance
génotype-environnement cest aussi la moyenne du phénotype (centré) des individus ayant un allèle
paternel (ou maternel) Bi.
a
i = Ej(Gij) = Ej(Pij)
Où Ej(Gij) signifie espérance de Gij sur tous les j possibles, en ayant fixé i.
Le terme dinteraction est défini par
bij = Gij - ai - aj
Par conséquent, pour nimporte quelle valeur fixée de i ou de j, lespérance de bij est nulle ainsi que sa
covariance avec les a.
Ej(bij) = Ej(Gij)-Ej(ai)-Ej(aj) =ai-ai-0 = 0
Covj (bij,ai) = Ej(bij ai) = ai Ej(bij) = 0
De même la covariance entre b
ij et bik
, j et k étant tirés indépendamment, est nulle
Cov
jk (bij,bik) = Ejk(bijbik) = Ej(Ek(bijbik))= Ej(bij Ek(bik))= Ej(bij 0)= 0
(b) Variances génétiques
On peut donc développer la variance génotypique V(G)
V(G)=V[a
i + aj + bij]
= V(ai) + V(aj) + V(bij) + 2 cov(ai aj)+2 cov(ai bij)+2 cov(aj bij)
2015 Introduction à la génétique quantitative - Cours 1 Jacques David, & Patrice David
5
Les termes cov(a
i
b
ij
) et cov(a
j
b
ij
) sont nuls par construction
cov(a
i
a
j
) est nulle si les allèles paternels et maternels sont tirés indépendamment, ce qui est le
cas pour un individu quelconque en panmixie.
Par ailleurs V(a
i
) = V(a
j
)=V(a)
On pose classiquement :
- la variance additive V
A
= 2 V(a) (la breeding value est Aij= a
i + aj)
- la variance de dominance V
D
= V(b
ij
)
d
V(G)= V
A
+V
D
Lhéritabilité au sens strict est définie par
h² = V
A
/ V(P)
(c) Extension à plusieurs locus
Quand plusieurs locus déterminent le caractère, il faut élargir le modèle :
(i) faire la somme des effets a
i (k)
a
j (k)
et b
ij (k)
produits par tous les locus k.
(ii) ajouter des termes dinteraction très nombreux si les interactions entre locus ne sont pas purement
additives (interactions entre un allèle du locus 1 et un allèle du locus 2, entre un allèle du locus 1 et
une paire dallèles du locus 2, entre deux paires dallèles aux locus 1 et 2... etc) ; toutes ces
interactions représentent ce quon désigne collectivement par « épistasie »
Par ailleurs la condition de panmixie à la génération précédente assure que les allèles paternels sont
indépendants des maternels MAIS elle nassure pas que les allèles maternels au locus 1 soient
indépendants des allèles maternels au locus 2 ... on peut donc avoir des covariances non nulles entre
des effets alléliques dune même origine (des cov (
ai (k), aj (l)
) qui vont intervenir dans lexpression de
la variance génétique totale. Ces covariances seront nulles sil ny a pas de déséquilibre de liaison
(ou déquilibre gamétique)... moyennant cette condition on aura
V(G)= VA +VD + VI
V
A
est la somme des variances additives des différents locus
V
D
est la somme des variances de dominance des différents locus
V
I
désigne la variance dinteraction entre locus (= épistasie), cest-à-dire un gros paquet hétéroclite
dinteractions... souvent on les considère comme faibles ou nulles, car elles sont difficiles à quantifier !
(d) régression parent-enfant en reproduction sexuée
En reprenant le même calcul quen population asexuée, on obtient (toutes les étapes du calcul étant
identiques) la covariance mère-enfant :
cov( PM, PO) =cov( GM, GO)
1 / 13 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !