La réponse à la sélection

publicité
Génétique quantitative 2015 – La sélection
La réponse à la sélection
But :
En sélection artificielle : améliorer la valeur d’une population dans une direction désirée
- en choisissant les parents de la prochaine génération
- en contrôlant la manière dont les parents sont recroisés (e.g., en autofécondation,
en allofécondation)
Dans l’étude de population naturelles, comprendre comment la sélection modifie le trait dans
une population, en moyenne et en variance, et découvrir quelles sont les trajectoires
évolutives des populations et comprendre sur quels traits la sélection agit le plus
Prédiction de la valeur des descendants sélectionnés
En utilisant le cadre développé dans les séances précédentes, il faut prédire le changement de
moyenne des descendants à partir de la moyenne des individus sélectionnés.
On appelle R la réponse à la sélection. C’est le changement de moyenne phénotypique
entre la génération parentale et les descendants issus des individus sélectionnés. Lorsque,
par convention, on a centré le phénotype sur zéro dans la génération parentale (phénotype
centré P = Y-µ où µ est la moyenne parentale ; par la suite cette transformation est appliquée
par défaut) , R égale la moyenne phénotypique centrée des descendants (en gardant comme
référentiel la moyenne parentale pour le centrage).
Faire une sélection, quest-ce que c’est ?
Exercer une sélection, c’est faire en sorte que tous les individus de la génération
parentale ne se reproduisent pas de la même façon, en privilégiant la reproduction de ceux qui
ont un certain phénotype (désiré par le sélectionneur). Si l’on veut par exemple augmenter P,
on fera reproduire en priorité les parents ayant une forte valeur de P ; un descendant de cet
épisode de reproduction aura des parents qui en moyenne ont une valeur phénotypique
supérieure que la moyenne de la population de parents (zéro, si on utilise un phénotype
centré). On peut traduire ceci par
Σ Pi wi / Σ wi > 0
Pi est le phenotype de l’individu i, wi est le nombre de descendants qu’il laisse,
contrôlé par le sélectionneur.
ou encore “la moyenne des phenotypes parentaux pondérés par la contribution de
chaque parent à la génération suivante est supérieure à zéro » (la moyenne arithmétique
non pondérée vaut zéro du fait du centrage). Cette moyenne pondérée est appelée différentiel
de sélection, et notée S.
Le moyen le plus couramment utilisé pour sélectionner est d’éliminer une partie des
parents (ceux dont le phénotype est inférieur à une certaine valeur-seuil) avant la
reproduction : seuls se reproduisent ceux qui sont au-dessus du seuil (individus sélectionnés) ;
il s’agit d’une sélection par troncation. Dans ce cas S est simplement la moyenne
phénotypique des parents sélectionnés. On peut la noter aussi DPp , changement de moyenne
phénotypique des parents dû à la sélection.
Génétique quantitative 2015 – La sélection
Phénotype de la descendance
•
•
b
= h2
•
OP
•
•
• •
•• • • •
•
•
•
• •
Réponse espérée
• • • • •• • • •
•• • •
• • • • • • ••• •• • • • • •
•
•
•
•
R
•• ••• • •• ••• ••• •• •• • •
•
• •• • •
• •
•
•
•• ••• • •• •• • ••• ••• •• • • • ••• • • • • ••• •
••
Phénotype du
••
•• ••• •• • ••• • • ••• • •• • •••• •• •• ••
•
•
• • • • •••• • ••• ••• •• •••• • • •• ••••• •••••• •••• • • • •• •
•
•
•
•
•
•
parent moyen
• • •• • ••• •••• • •••• •• ••••• ••• • ••• ••• ••• • •••• ••••• •
• • ••
•
•• • •
•
•
• • •• •• • ••• • ••• ••• ••• • • •••• •••••••••••••• ••••••••••• •••• •••••••• •••• •• •
•
• • •• • ••• ••• • •• •• ••• •• ••••• ••••• •••••• ••• ••• •• ••• ••• • • ••
•••
• •• ••• •• •• •••••• •••••• ••• •••• • •• •••• • ••••• • •• •• ••••• ••••••• •• •• • • ••••
• • • •• •• • • •• ••••• ••••••••• •••• •••••• •••• ••••• ••• •• •••• ••• • • • ••• ••• •••• ••• •
•
•
• •
Moyenne des
•
• • • • • •• •• •• • •••• •• •••• ••• •• •••• • • ••••• ••• • •• •
•
• • • •• • • • • • • •
•
• • ••• • ••• •• • •• • • ••
•
•
parents
••• • •• ••
••
•
•
•
•
•
• •• • • • •• • ••• • •••••• • • •
•
sélectionnés
•
•
• •
••
•• •
•
•
•
Différentiel de sélection
S
Parents sélectionnés
Point de
troncation
Moyenne de la population de parents possibles
S = Σ Pi wi / Σ wi = DPp
Que vaut la réponse à la sélection ?
Nous avons vu que la valeur génotypique des enfants Po peut être prédite à partir du
phénotype des parents Pp (midparent value) par la régression suivante
Po= b Pp + e ( Eq. 1)
où la pente de la régression vaut b = cov(Po,Pp)/V(Pp)= h²= V(A)/V(P) dans le cas d’une
reproduction sexuée, d’une espèce diploïde panmictique
Rappelons que dans le cas de lignées ou de clones (sans reproduction sexuée), alors
b= cov(Po,Pp)/V(Pp)= H²= V(G)/V(P). Dans ce cas, les « enfants » sont soit des boutures issues des
parents soit des graines produites par des lignées fixées. Il en va de même pour des organismes
haploïdes.
L’espérance de e est nulle par suite du centrage des variables :
e =Po - b Pp
E(e) = E(Po)- b E(Pp) = 0
De même, la covariance cov(e, Pp) peut s’écrire
= cov(Po - b Pp, Pp) = cov(Po,Pp) – cov(b Pp,Pp) =
= cov(Po,Pp) - b cov(Pp,Pp) = cov(Po,Pp) – cov(Po,Pp) V(Pp)/ V(Pp)
= cov(Po,Pp) - cov(Po,Pp)
=0
Génétique quantitative 2015 – La sélection
Donc e est indépendante de Pp et d’espérance nulle, quelle que soit la distribution
sous-jacente de Pp.
Que vaut la moyenne des descendants issus des parents sélectionnés ?
Les parents sélectionnés ont comme moyenne S= DPp . Leur descendants ont comme moyenne
R (par définition).
En utilisant l’équation 1 :
R = E(Po / parents sélectionnés)
=E(b Pp + e / Parents sel)
= b E( Pp/sélection) + E(e/Parents sel)
= b S + E(e/Parents sel)
La valeur de E(e/Parents sel) représente la moyenne de e chez le sous-ensemble de parents qui
ont été sélectionnés. Cette moyenne est nulle sous certaine conditions : nous avons remarqué
que cov(e, Pp)=0 ; c'est-à-dire que e et Pp sont indépendants. Intuitivement on imagine bien
que en touchant à la moyenne de Pp on ne change pas celle de e (la condition cov(e, Pp)=0
est en fait nécessaire mais pas suffisante, voir remarque ci-après), donc
E(e/Parents sel)=E(e)=0
et
R= b S.
En remplaçant b par sa valeur (en population sexuée panmictique, h²) on obtient
L’« équation du sélectionneur » : R = h² S.
En population asexuée h² doit être remplacée par H².
Remarque : La condition cov(e, Pp)=0 est nécessaire mais pas tout-à-fait suffisante pour que
E(e/Parents sel) = 0. En effet il se pourrait que la relation Pp - Po soit non linéaire; dans ce cas
même si la valeur de b a été choisie pour que cov(e, Pp) =0 (ce qui en fait la meilleure valeur
possible pour une régression linéaire), la moyenne conditionnelle de e sur un certain intervalle
de Pp, en particulier E(e/Parents sel) peut être différente de zéro comme le montre la figure cidessous.
Génétique quantitative 2015 – La sélection
Figure : à gauche, la régression est linéaire, la distribution de e est symétrique avec autant de
positifs (bleu) que de négatifs (jaune), et ce même en restreignant les parents à ceux qui sontau dessus du point de troncation T. A droite, la relation est non-linéaire ; sur l’ensemble, il y a
autant de positifs que de négatifs mais au-dessus du point de troncation T il reste une majorité
de positifs donc E(e/Parents sel) >0.
Sous quelles conditions la régression est-elle linéaire ? On ne le sait pas trop, mais on espère
qu’elle l’est à peu près et que sinon l’erreur faite est faible. Si nous supposons que les
phénotypes parentaux et des descendants résultent de l’addition de nombreux effets
génétiques et environnementaux très petits, un théorème mathématique prédit que ces
phénotypes auront une distribution normale bivariée, ce qui garantit la linéarité de la
régression. Mais cela revient en fait à supposer qu’une infinité de gènes porteurs d’allèles à
effet infiniment petit déterminent ce caractère (modèle infinitésimal).
Que se passe t il si la sélection n’est pas faite de manière identique entre les deux sexes ?
R = bmSm + b f Sf = 12 h 2Sm + 12 h 2Sf = h 2 12 (Sm + Sf )
Traduction de S en intensité absolue de sélection
Cette démarche est nécessaire pour savoir si on applique une plus forte sélection sur l’un ou
l’autre caractère. Comparer S directement n’est pas possible (unités différentes entre les deux
caractères, par ex des mètres et des grammes). Nous devons le standardiser pour obtenir des
échelles comparables d’intensité de sélection i. Cette intensité est définie par :
S = i sp
qui représente le différentiel de sélection « en unités d’écart-type phénotypique ».
Derivation de l’intensité de la sélection
dans une loi normale
i = z/p
s=1
p
z
0
x
i
Génétique quantitative 2015 – La sélection
. Si x est le point de troncation, alors p est la proportion d’individus sélectionnés et i est
l’intensité de la sélection.
Et le progrès génétique devient :
s A2
R = h i s P = 2 i s P = ihs A
sP
2
Les valeurs de i sont tabulées.
Relation entre le taux de sélection (p dans le graphe précédent), x point de troncature en unité
d’écart type et i intensité de la sélection
x
i
p (%)
0.01
3.79
3.96
0.1
3.09
3.36
1
2.43
2.76
2.5
1.96
2.35
10
1.28
1.75
50
0
0.80
Dans une population grande, l’intensité de la sélection varie. Pour des populations inférieures
à 50 individus il faut effectuer une correction.
Selection intensity
Relation entre I et la proportion
d’individus sélectionnés
Grande population
3
2.5
2
1.5
1
0.5
0
0
20
40
60
80
100
% selected
CPAB3
De même quand la sélection porte indépendamment sur les deux sexes :
R = 12 (im + if )h2σP
Génétique quantitative 2015 – La sélection
Par exemple, dans le cadre d’une sélection sur le poids des agneaux au sevrage on a les
valeurs suivantes h²=0.3, sp=3.6 kg . On sélectionne les 5% (im=2.06 ) meilleurs mâles et les
60% meilleures femelles (if=0.64) sur leur phénotypes, on trouve qu’en un cycle de sélection,
R = ½ (2.72) 0.3 3.6= 1.47 kg
Mesurer la réponse à la sélection
Pour une bonne prédiction de la réponse à la sélection , il faudrait estimer les paramètres sur
plusieurs générations et sur des populations de taille suffisantes. En effet, la dérive génétique,
les erreurs d’échantillonnage d’estimation de la valeur moyenne et l’impact des facteurs
environnementaux font que nombre d’estimations des paramètres sont imprécises et variables
dans le temps.
Une façon de procéder est de valider le progrès réalisé à partir du progrès prédit sur la
génération des parents et de calculer l’héritabilité réalisée au travers de plusieurs générations.
Effet de la sélection sur la variance
La sélection induit des changements de fréquence aux locus impliqués dans la variation du
trait. Est-ce qu’on peut s’attendre à des changements dans la variance d’une population ?
On peut montrer que pour des a petits, le changement de fréquence est relativement modéré à
chaque locus même pour des intensités fortes.
Pour un locus x dont les allèles ont des effets complètement additifs, on peut écrire que
- Si Dq est la différence de fréquence de l’allèle défavorable, alors le changement de
moyenne est Dµ = -2a Dq
-
V(A)x=2pqa² (où a est défini comme dans le modèle de Fisher avec c=0)
D ( V(A)x ) = 2 p1q1 a² - 2 p0q 0 a2 = 2a² Dq + 2a² (qo²-q1²)
Si a est petit alors a² est encore plus petit…donc sur quelques générations la variance ne
change pas.
Mais la sélection introduit une covariance négative entre locus (c’est l’effet Bulmer) ; cette
covariance réduit la variance et apparaît dès les premières générations. Chaque gène a de
nombreux allèles. Si le génotype est la somme des effets génétiques à chaque locus, une
sélection sur la somme à partir d’une valeur seuil créée des associations négatives entre les
Selection sur la somme de deux locus non liés
Individus sélectionnés
Locus 1
Distribution avant la
selection
Seuil de troncation pour la
sélection
Locus 2
Génétique quantitative 2015 – La sélection
allèles favorables entre les différents locus et ces corrélations se transmettent au travers d’un
déséquilibre de liaison a niveau des gamètes.
La variance totale est :
VA = Var(A1+A2) = Var(A1)+Var(A2) + 2Cov(A1,A2)
Avant la selection Cov(A1,A2) = 0
après sélection Cov(A1,A2)<0 è VA *<VA
La variance diminue phénotypiquement mais elle est mise en réserve dans le déséquilibre de
liaison et pourra être relarguée lorsque la pression de sélection diminuera.
Que vaut l'équation du sélectionneur quand on a une forme de sélection autre que la
troncation ?
Le problème est d'arriver à obtenir une expression générale pour le différentiel de
sélection S [ = Σ Pi wi / Σ wi = DPp ].On part du principe que la fitness w est une fonction
continue quelconque w(P) du phénotype P et de lui seul. Chaque phénotype Pi ayant laissé
après sélection une proportion wi / w de descendants (la division par la fitness moyenne est là
pour assurer que la moyenne du nombre de descendants laissés fasse 1; elle n'est pas
nécessaire si la fonction de fitness a été définie dès le départ de sorte à ce que sa moyenne soit
1) on aura
S = DPp = å p i Pi (
i
wi
1
1
) - P = (E ( Pw) - P w ) = Cov( P, w)
w
w
w
Le différentiel de sélection est donc égal à la covariance entre un trait et la fitness
normée (de telle sorte à ce que sa moyenne soit 1).
Lorsque w(P) est une fonction compliquée, il n'y a pas d'écriture générale de S. Un
moyen d'obtenir une écriture approchée est de supposer que les phénotypes ont une variance
relativement faible autour de leur moyenne ce qui permet d'approcher au premier ordre w(P)
par une fonction linéaire autour de la moyenne phénotypique :
w( P) = w( P ) + ( P - P ) w' ( P ) + O(V ( P))
où w' est la dérivée de w et O(V(P)) est un terme de l'ordre de V(P), que nous
négligerons par la suite. [NB on peut en reprenant les conventions précédentes remplacer la
moyenne phénotypique par zéro partout (phénotype centré), mais le calcul est fait sans cela
pour montrer que le résultat ne dépend pas de cette convention]
on peut alors écrire (en se rappelant que la covariance d'une variable avec une constante est
toujours nulle)
Cov( P, w) » Cov( P, w( P ) + ( P - P ) w' ( P )) = w' ( P )V ( P)
On a donc S = β V(P) où
w' ( P )
est le gradient de sélection. Une écriture plus courante de ce gradient utilise le fait
w
que la valeur approximative de la fitness moyenne est w(P ) ce qui donne :
b=
Génétique quantitative 2015 – La sélection
b=
w' ( P ) dLn( w)
=
w( P )
dP P = P
Nous obtenons donc une écriture de l'équation du sélectionneur :
R = h2 S =
V ( A)
V ( P) b = V ( A) b
V ( P)
Pour une espèce asexuée on remplacerait V(A) par V(G).
La sélection sur un caractère X peut-elle avoir un effet sur un caractère Y ?
Dans beaucoup de cas, on peut penser que oui. Par exemple, en sélectionnant sur la
taille, nous obtiendrons probablement une réponse sur le poids car ces deux caractères sont
très fortement corrélés.
La régression parent-enfant dont nous avons besoin est de forme (en reproduction
asexuée)
Ydescendant = bYX Xparent+ ε
La pente bYX est une régression de YO sur XP.
BYX = Cov(YO, XP) / VP(X)
Génétique quantitative 2015 – La sélection
Il nous reste à trouver la valeur de Cov(YO, XP)...
Pour cela, plaçons-nous d’abord dans un cas simple de reproduction asexuée (clonale) : on
peut alors écrire
Cov(YO, XP) = Cov(GYO+EYO, GXP+EXP)
=Cov(GYO,GXP)+Cov(GYO,EXP)+Cov(EYO, GXP)+Cov(EYO,EXP)
En l’absence d’effets maternels ou parentaux, les termes surlignés sont nuls et la covariance
se réduit à un terme
Cov(YO, XP) = Cov(GYP,GXP)
Qu’on écrit aussi CovG(Y,X), la covariance génétique entre X et Y.
La réponse corrélée de Y à la sélection sur X sera donc
RY = (CovG(Y, X) / VP(X)) SX
Nous aurons bien sûr aussi une réponse directe de X : RX = (VG(X) / VP(X)) SX
ce qu’on peut noter sous forme vectorielle
æ RX
çç
è RY
ö æ VG ( X ) ö S X
÷÷ = çç
÷÷
ø è COVG ( X , Y ) ø V P ( X )
Remarque : on peut définir le coeff de corrélation géntéique comme
rG =
COVG ( X , Y )
VG ( X )VG (Y )
Lorsque la reproduction est sexuée, si les deux parents sont soumis à sélection, tous les
calculs sont valables en remplaçant les VG par des VA et des COVG par des COVA (covariance
génétique additive)
Reproduction sexuée
æ RX
çç
è RY
rA =
ö æ VA ( X ) ö S X
÷÷ = çç
÷÷
ø è COV A ( X , Y ) ø V P ( X )
COV A ( X , Y )
V A ( X )V A (Y )
Que se passe-t-il si on sélectionne sur plusieurs caractères à la fois ?
Dans beaucoup de cas (notamment dans la nature) la sélection porte sur plusieurs
caractères ensemble, ce qui pose plusieurs problèmes
Génétique quantitative 2015 – La sélection
(i) nous aurons pour chaque caractère une réponse directe et une ou plusieurs indirectes ( ces
dernières étant dues à la sélection sur les autres traits).
(ii) les caractères peuvent être phénotypiquement corrélés au départ, ce qui modifie l'intensité
de la sélection sur chacun d'eux; en effet, en sélectionnant les phénotypes ayant une valeur
élevée de X (par exemple la taille), on prend aussi des individus qui tendent à avoir une valeur
élevée de Y (par exemple le poids de graines). Pour quantifier la sélection sur Y en tant que
tel, il faut quantifier l'intensité du surcroît de sélection sur Y en plus de ce qui serait déjà
obtenu en sélectionnant sur X (c'est à dire, est-ce que pour un certaine valeur de X, les
descendants sélectionnés ont une valeur Y supérieure à ce qu'on prédirait juste en connaissant
la corrélation entre X et Y).
La technique qui permet de résoudre ce problème est la régression multiple. Nous
avons déjà vu que la réponse à la sélection sur X s'exprimait grâce à une régression simple du
phénotype de l'enfant sur celui du parent (en supposant qu'il n'yen à qu'un, c'est à dire pour
simplifier, dans le cas d'une reproduction asexuée) de forme :
XO = b XP + ε
où b= COV(XO , XP ) / V(XP)
Dans une régression multiple à deux caractères X et Y on écrit un système étendu à deux
variables qui prédit X et Y des enfants en fonction des X et Y des descendants :
ì X O = b XX X P + b XY YP + e X ü
í
ý
î YO = bYX X P + bYY YP + e Y þ
Que l'on peut écrire sous forme matricielle
æ X O ö æ b XX
çç
÷÷ = çç
Y
è O ø è bYX
b XY öæ X P ö æ e X
֍
÷+ç
bYY ÷øçè YP ÷ø çè e Y
ö
÷÷
ø
ou en abrégé (formule valable quel que soit le nombre de caractères) :
XO = b.XP + ε (les lettres en gras désignent des vecteurs ou matrices)
La matrice des coefficients de régression b est donnée par la formule suivante (en lieu et place
de la formule b= COV(XO , XP ) / V(XP) dans le cas univarié)
b = C. V-1
où
æ b XX
b = çç
è bYX
b XY ö
÷ est la matrice des coefficients de régression;
bYY ÷ø
æ COV ( X O , X P ) COV ( X O , YP ) ö
÷÷ est la matrice des covariances entre variables prédites
C = çç
è COV (YO , X P ) COV (YO , YP ) ø
(enfants) et variables prédictrices (parents)
Génétique quantitative 2015 – La sélection
COV ( X P , YP ) ö
æ V (X P )
÷÷ est la matrice de variance-covariance des variables
V = çç
V (YP )
è COV ( X P , YP )
ø
préditrices XP et YP, qui dans notre cas représentent les variances et covariances
phénotypiques dans la population de parents avant sélection.
Application au cas de reproduction asexuée
On régresse les phénotypes (plusieurs traits) des enfants sur ceux des parents : la matrice C
est alors la matrice de variance-covariance génétique de la population (notée G) :
COVG ( X , Y ) ö
æ VG ( X )
÷=G
C = çç
VG (Y ) ÷ø
è COVG ( X , Y )
alors que la matrice V est la matrice de variance-covariance phénotypique de la population
(notée P)
COV P ( X , Y ) ö
æ VP ( X )
÷=P
V = çç
V P (Y ) ÷ø
è COV P ( X , Y )
d'où la régression parent-enfant sur plusieurs traits :
b = G. P-1
et son application pour prédire la réponse à une sélection multivariée :
L'équation multivariée du sélectionneur (en asexué)
R = G. P-1. S
æR ö
æS ö
où R = çç X ÷÷ et S = çç X ÷÷ sont les vecteur de réponses à la sélection, et de différentiels de
è RY ø
è SY ø
sélection, pour les deuxt traits X et Y.
Extension au cas de reproduction sexuée
En suivant la même démarche nous obtenons
L'équation multivariée du sélectionneur (en sexué)
R = A. P-1. S
où
Génétique quantitative 2015 – La sélection
COV A ( X , Y ) ö
æ VA ( X )
÷ est la matrice de variance-covariance génétique additive
A = çç
V A (Y ) ÷ø
è COV A ( X , Y )
de X et Y dans la population.
Ecriture des gradients de sélection sur plusieurs caractères
Pour exprimer les gradients de sélection dans le cas d'une fonction de fitness continue
sur un seul trait (w(X)) nous avons cherché la pente de cette fonction (normée par la fitness
moyenne) au voisinage de la moyenne de la poulation, c'est à dire aproché la fonction par une
droite au voisinage de cette moyenne.
w( X )
= constante + b X + termes négligeables
w
Dans le cas à deux variables, on approxime par un plan (au lieu d'une droite), c'est à dire par
une équation à deux coefficients (deux "pentes") de forme :
w( X , Y )
= constante + b X X + b Y Y + termes négligeables
w
pour estimer les deux coefficients bêta, il faut faire une régression (multiple) de la
fitness normée (ou du log de la fitness) sur les diverses variables phénotypiques (X, Y).
On peut alors montrer qu'approximativement, le différentiel de sélection créé par une telle
fonction de fitness vaut :
æSX
S = çç
è SY
ö
æb
÷÷ = P.çç X
ø
è bY
ö
÷÷ = P.β
ø
D'où
β = P-1. S et l'expression de la réponse à la sélection :
R = G. β (en asexué)
R = A. β (en sexué)
Cette formule représente l'évolution d'une population (R) comme un compromis entre:
(i) une direction de sélection dans l'espace multivarié des traits (celle qui est pointée par le
vecteur β du gradient de sélection)
(ii) une forme intrinsèque liée au réseau de corrélations génétiques entre traits représenté par
la matrice G (ou A) : la sélection sera d'autant plus facile qu'elle est dirigée selon l'axe majeur
de la matrice G (ou A).
Que se passe-t-il si la valeur sélective n'est pas expliquée seulement par les traits observés ?
L'équation R=h²S appliquée à un caractère n'est pas valable s'il existe des caractères
non observés sur lesquels la sélection agit puisque nous avons vu que dans ce cas nous devons
tenir compte de la réponse corrélée à la sélection. Par extension même si nous considérons
plusieurs traits et l'équation multivariée du sélectionneur R = A. β, l'équation ne sera valable
Génétique quantitative 2015 – La sélection
que si tous les traits sélectionnés sont inclus; s'il existe un trait non mesuré qui est fortement
sélectionné et corrélé avec les autres, les réponses des traits que l'on mesure seront différentes
de ce qui est prédit par notre équation. Conclusion : une mesure de sélection et une
prédiction de réponse à la sélection sont relatives à un ensemble de traits considérés.
L'inclusion d'un nouveau trait va modifier les valeurs de R et β; il est donc important
d'essayer d'inclure dans l'analyse tous les traits que l'on juge agir sur la valeur sélective.
Par ailleurs, nous avons jusqu'ici supposé (dans notre analyse des réponses à la
sélection) que la relation qui liait les phénotypes et la valeur sélective était de nature purement
causale. La valeur sélective était modélisée comme une régression sur le phénotype; et la
nature génétique ou environnementale des variations du phénotype n'était pas importante : par
exemple,dans une sélection par troncation, on choisit les plus gros animaux sans privilégier
ceux qui sont gros pour des raisons génétiques par rapport à ceux qui sont gros pour des
raisons environnementales.
Or, dans certains cas, il peut y avoir une corrélation (positive ou négative) entre la
valeur sélective et un trait, non due à une causalité directe. Nous en avons vu un exemple
jusqu'ici : s'il existe un trait Y qui est corrélé à X d'un côté et qui agit sur la valeur sélective de
l'autre, on aura une relation de corrélation non causale entre X et la valeur sélective. Nous
avons vu que l'inclusion d'autres traits (Y) modifie la réponse à la sélection sur X à travers des
réponses indirectes à la sélection.
Une autre source de déviation par rapport à la prédiction R= h² S est l'existence de
corrélations environnementales différentes des corrélations génétiques, entre le trait P et
la valeur sélective . Imaginons par exemple qu'une plante fasse plus de feuilles lorsqu'elle est
à l'ombre qu'au soleil (car elle a besoin de plus de surface foliaire pour capter la même
énergie); les plantes à l'ombre n'arrivent cependant pas à faire autant de fleurs que les plantes
au soleil et ont donc une valeur sélective moins bonne (covariance environnementale négative
entre nombre de feuilles et valeur sélective); en revanche, parmi les plantes qui sont au soleil,
celles qui ont plus de feuilles (en raison de leur génotype) récupèrent plus d'énergie et font un
peu plus de fleurs; de même parmi les plantes qui sont à l'ombre (covariance génétique
positive entre valeur sélective et nombre de feuilles).
Dans ce cas, si l'on établit le gradient de sélection ou le différentiel de sélection à
partir des phénotypes, on aura sans doute l'impression que la sélection défavorise globalement
les plantes ayant plus de feuilles, car toutes les plantes à l'ombre, qui ont chacune beaucoup de
feuilles, laissent peu de descendants.
S (apparent) =
1
1
Cov( P, w) = [CovG ( P, w) + CovE ( P, w)]
w
w
Dans cette équation on peut supposer que S(apparent) <0 car la covariance génétique CovG est
positive et la covariance environnementale CovE est négative, mais plus forte en valeur
absolue que la précédente.
Pourtant la sélection réelle s'exerce dans l'autre sens et la réponse à la sélection sera
positive puisque les génotypes produisant beaucoup de feuilles (P élevé) sont favorisés dans
tous les environnements.
Génétique quantitative 2015 – La sélection
Un moyen de prédire la réponse à la sélection, sans se faire avoir, est de considérer
que ce qui compte, ce n'est pas le phénotype mais bien le génotype des parents qui produisent
le plus de descendants. En d'autres termes, au lieu d'utiliser la régression du phénotype des
descendants PO sur le phénotype parental PP, comme nous l'avons fait au départ pour établir
l'équation du sélectionneur, nous devrions utiliser la régression de GO sur GP.
Cette régression est simplement GO = GP dans le cas asexué que nous prenons pour
simplifier (la pente est de 1 car le génotype du parent est égal à celui du descendant). Nous
obtenons
R= DGO = DG p = Σ Gi wi / Σ wi =
1
Cov (Gi , wi )
w
où Gi est la valeur génétique du parent i pour le trait considéré (nombre de feuilles) et wi sa
valeur sélective. Nous pouvons aussi décomposer la valeur sélective w en une valeur
génétique Gw et une valeur environnementale Ew.
Cov (Gi , wi ) = Cov (Gi , Gwi ) + Cov (Gi , Ewi ) = Cov G ( P, w) + Cov (Gi , Ewi ) .
Si les plantes sont distribuées au hasard entre les deux environnements (ce qui veut dire
qu'elles ne sont pas génétiquement meilleures à l'ombre qu'à l'obscurité et vice-versa) alors
Cov (Gi , Ewi ) doit être nulle. Il en résulte
R=
Cov G ( P, w)
w
qu'on peut réécrire en cas de reproduction sexuée (tout reste valable en remplaçant les
covariances génétiques par des covariances génétiques additives):
R=
Cov A ( P, w)
w
Equation de Price
Cette équation est très générale; elle est valable pour n'importe quel caractère en
présence de sélection sur d'autres caractères (les effets indirects de la sélection s'incorporeront
naturellement dans le terme de covariance génétique) et en présence de covariance
environnementale entre les traits et la valeur sélective. Le seul problème est la nécessité de
pouvoir mesurer CovA(P,w) ce qui n'est pas toujours facile. Dans tous les cas de sélection
artificielle, par exemple, on peut raisonnablement supposer que la valeur sélective est
directement causée par le phénotype via l'action du sélectionneur (exemple sélection par
troncation, basée sur le phénotype uniquement, et en environnement le plus contrôlé possible)
et du coup il vaut mieux utiliser l'équation du sélectionneur. Dans la nature, on peut mesurer
des gradients de sélection par la technique des régressions multiples; mais l'utilisation des
pédigrées permet de quantifier les variances et covariances additives de tous les caractères (y
compris du caractère représentant la valeur sélective : nombre de descendants survivants ou
de graines) et dans ce cas on peut utiliser directement l'équation de Price.
Téléchargement