Poly de TD Gpops 2016 - Cours en Ligne

publicité
GENETIQUE DES POPULATIONS
Support de travaux-dirigés
2016-2017
UFR de Génétique Évolutive et Amélioration des Plantes
Karine Alix-Jenczewski, [email protected]
Philippe Brabant, [email protected]
Julie Fiévet, [email protected]
Pierre Gérard, [email protected]
Jean-Pierre Henry, [email protected]
AVERTISSEMENT
Le présent document sert de support aux travaux dirigés. Il présente des
exercices qui seront développés au cours des séances de TD, et il résume dans
des encadrés introductifs ou de bilan de chaque séance, les notions essentielles à
retenir en génétique des populations.
Il ne dispense pas de la lecture du cours polycopié intitulé "Génétique des
Populations". Vous serez supposés avoir lu et compris ce polycopié de cours en
vue de l'examen, à l'exception de certains passages traitant de notions non vues
en TD, et qui vous seront précisés en temps utile. Aussi, il vous est vivement
recommandé de faire cette lecture au fur et à mesure de l'avancement des TD.
Les chapitres et pages du polycopié correspondant aux notions traités aux
diverses séances sont précisées dans ce document-ci, à la fin du texte
correspondant à chaque séance.
La génétique des populations s'intéresse à la composition génétique des populations et à ses
variations dans l’espace et dans le temps. Elle fournit un cadre formel permettant de décrire
cette composition, de comprendre les mécanismes qui déterminent l'évolution des
populations, pour reconstruire leur histoire ou prédire leur évolution future. Ses applications
concernent les divers domaines de, l’évolution, la sytématique, la gestion des populations
naturelles ou domestiques (sélection, conservation, lutte...), la gestion de la biodiversité, et de
domaines qui ont trait à la diversité génétique humaine (médecine, épidémiologie, pharmacogénétique, médecine légale...)
Quelques définitions :
Gène : unité d'information biologique, transmise au cours des générations, codant pour une
fonction. Correspond à une séquence d'une macromolécule (ADN ou ARN) transmise
telle quelle (à de rares modifications près), transcrite et généralement traduite par un
système biochimique idoine, ce qui permet l'expression d'une activité biologique.
Locus : historiquement, position du gène sur le chromosome. En génétique des
populations, ensemble de gènes homologues (classe d'homologie). Deux chromosomes
ou deux gènes sont homologues s’ils s’apparient et s’excluent mutuellement à la
méiose : on ne trouvera donc pas deux gènes homologues présents en même temps dans
une cellule haploïde.
Gènes allèles : deux gènes homologues sont dits allèles quand ils ont des formes
différentes. Un allèle est donc une classe de gènes homologues qu’on ne distingue pas
entre eux au niveau phénotypique. Le phénotype est ce qu’on observe, il dépend donc
du niveau d’observation. Dès lors, le nombre d’allèles identifiés à un locus dépend lui
aussi du niveau d’observation. Par exemple, pour une enzyme on peut trouver deux
allèles lorsqu’on s’intéresse à sa fonctionnalité (fonctionnelle vs non fonctionnelle),
mais au sein de chacun de ces deux allèles il est possible d’observer différentes
séquences protéiques et en remontant jusqu’aux gènes différentes séquences
nucléotidiques. Pour une même protéine, le nombre d'allèles trouvés au niveau des
séquences est en général beaucoup plus élevé que le nombre observé au niveau
macroscopique.
Gènes identiques par descendance : gènes issus de la transmission d'un même gène
ancestral, sans qu'aucune mutation ne se soit produite dans la chaîne de parenté.
Haplotype : séquence (pouvant couvrir plusieurs gènes et séquences non codantes, et
même tout un chromosome) qu'on reconnaît comme différente d'une autre séquence
homologue. Plus particulièrement utilisé pour désigner le génotype haploïde pour un
ensemble de gènes ou séquences étroitement liés sur un chromosome (donc tendant à
être hérités en bloc) et différent d'un autre en plusieurs sites. Le terme s'est imposé avec
le développement des méthodes moléculaires permettant de caractériser les séquences
d'ADN.
Génétique des populations - 1ère année AgroParisTech – 10/2016
1
Diversité génétique d’une population traditionnelle de maïs
révélée par un marqueur RFLP :
sonde BA1/enzyme HindIV
Figure 1 : Trois séries d’électrophorèses réalisées à partir d’un échantillon d’individus d’une
population traditionnelle de maïs et révélant un marqueur RFLP. Chaque puits contient
l’ADN d’un individu. Les puits notés "Témoin" sont des témoins de migration.
Deux allèles sont présents au locus considéré. On peut reconnaitre les homozygotes au fait
qu’ils ne présentent qu’une bande haute ou basse et les hétérozygotes qui ont les deux bandes.
Génétique des populations - 1ère année AgroParisTech – 10/2016
2
SEANCE N° 1
Structure génétique des populations
et Loi de Hardy-Weinberg
La brachydactylie envahira-t-elle l’espèce humaine ?
A un locus, la composition génétique d'une population est entièrement définie par les
fréquences génotypiques et les fréquences alléliques à ce locus. Les fréquences alléliques
se déduisent facilement des fréquences génotypiques.
Exemple : dans une population avec 50 individus dont 25 de génotype A1A1, 20 de génotype
A1A2 et 5 de génotype A2A2,
- les fréquences des génotypes A1A1, A1A2 et A2A2 sont respectivement 0,5, 0,4 et 0,1 ;
- il y a au total 100 gènes, dont 70 gènes A1 et 30 gènes A2; donc les fréquences des allèles A1
et A2 (notées traditionnellement p et q) valent respectivement p = 0,7 et q = 0,3.
Exercices :
1) Calculer les fréquences alléliques dans les populations suivantes :
AA
Aa
aa
(Effectif total)
Population 1 :
28
24
48
(100)
Population 2 :
16
48
36
(100)
Population 3 :
40
0
60
(100)
Population 4 :
0
80
20
(100)
Qu'en concluez-vous ?
2) Une population est analysée à un locus particulier, où elle présente la composition
suivante :
Génotypes
AA
Aa
aa
H0
R0
Fréquences D0
(D0, H0 et R0 sont les fréquences des trois génotypes à la génération 0. Ce sont des valeurs quelconques, dont
la somme fait 1; "D" pour "dominant", "H" pour "hétérozygote", "R" pour "récessif".)
Comment évoluent dans cette population les fréquences alléliques d’une part, et les
fréquences génotypiques d’autre part, si les gamètes A et a s'unissent au hasard (situation
appelée "panmixie") ?
Quelles sont les autres hypothèses implicites de ce modèle ?
3) Que pensez-vous de la suggestion de Yule (cf. p. suivante) concernant la brachydactylie
(cf. illustration au verso) ?
Génétique des populations - 1ère année AgroParisTech – 10/2016
3
Génétique des populations - 1ère année AgroParisTech – 10/2016
4
On retiendra :
•
Notions de fréquences alléliques et de fréquences génotypiques.
Connaissant les fréquences génotypiques, on peut toujours calculer les fréquences
alléliques. Mais à l'inverse, la connaissance des fréquences alléliques ne permet pas d'en
déduire automatiquement les fréquences génotypiques : il faut, pour cela, faire des
hypothèses sur la façon dont les gènes sont associés par paires dans les individus
diploïdes, c'est-à-dire sur la façon dont les gamètes s'unissent pour former les zygotes.
•
Notion de régime de reproduction.
C'est l’ensemble des phénomènes biologiques qui déterminent la façon dont les gamètes
de divers génotypes s'unissent à la fécondation, et donc la relation entre les fréquences
alléliques et les fréquences génotypiques.
•
Notion de: panmixie
C’est l’union au hasard des gamètes ou des porteurs de gamètes quant à leur génotype au
locus considéré.
•
Loi de Hardy-Weinberg (cf. polycopié)
Elle comporte deux aspects indépendants :
- Absence de pressions évolutives donc pas d'évolution des fréquences alléliques au cours
des générations successives ;
- Régime de reproduction panmictique impliquant une relation simple entre fréquences
génotypiques et alléliques. Si p=f(A) et q=(1-p)=f(a) sont les fréquences de A et a dans les
gamètes, les fréquences des génotypes AA, Aa et aa au sein de zygotes obtenus en
panmixie seront p2, 2pq et q2 respectivement.
Pages correspondantes du polycopié, à lire: p.1-7
Génétique des populations - 1ère année AgroParisTech – 10/2016
5
SEANCE N° 2
Influence du régime de reproduction
sur la structure génétique des populations
On appelle régime de reproduction l'ensemble des phénomènes biologiques qui influencent
la façon dont les gamètes ayant divers génotypes s'unissent à la fécondation, et donc la
relation entre les fréquences alléliques et les fréquences génotypiques. Les principaux régimes
de reproduction sont les suivants :
- Panmixie : union au hasard des gamètes, ou bien des porteurs de gamètes.
- Autogamie : chaque individu se reproduit par autofécondation.
- Régime consanguin : Les individus apparentés se reproduisent entre eux plus souvent
qu’au hasard. L’autogamie est une forme extrême de régime consanguin.
- Homogamie : Les individus qui se ressemblent pour un caractère phénotypique se
reproduisent entre eux plus souvent qu’au hasard.
- Hétérogamie : Les individus qui diffèrent pour un caractère phénotypique se reproduisent
entre eux plus souvent qu’au hasard.
Exercices :
1) Dans une population de plantes à fleurs, où les fréquences initiales des trois génotypes à un
locus sont les suivantes :
Génotypes
AA
Aa
aa
Fréquences D0
H0
R0
Calculer l’évolution des fréquences génotypiques et des fréquences alléliques au cours des
générations, en l’absence de pressions évolutives, si le régime de reproduction est :
- l’autogamie
- un régime mixte : pour chaque individu, une proportion (1– t) de ses graines est produite
par autofécondation, et le reste des graines (en proportion t), est produit en panmixie.
(Exprimer Hn, fréquence des hétérozygotes à la génération n en fonction de Hn-1, et
chercher la fréquence d’équilibre He.)
2) Dans une population humaine, existent deux phénotypes [A] et [a], déterminés par un locus
à deux allèles, A et a, avec A dominant sur a. La structure génétique est quelconque
(proportions D0, H0 et R0 des trois génotypes). Un dictateur fou décrète que les seules unions
autorisées, dorénavant, sont les unions [A]×[a].
- Comment va évoluer la structure génétique de la population, en supposant que le décret
est parfaitement appliqué ? (considérer la situation après deux générations)
- Que pouvez-vous dire des fréquences alléliques ? Et de la proportion d'hétérozygotes
(comparer à 2pq) ?
- Connaissez-vous des systèmes génétiques qui fonctionnent comme ce système politique ?
Génétique des populations - 1ère année AgroParisTech – 10/2016
6
Régimes de reproduction
On retiendra :
•
Régime de reproduction panmictique (p2, 2pq, q2), régime ouvert (fréquence des
hétérozygotes H > 2pq), régime fermé (H < 2pq).
•
Différents types de régimes de reproduction fermés : autogamie (crée un déficit en
hétérozygotes sur l'ensemble des locus, mène à l'homozygotie complète quand l'autogamie
est à 100%), consanguinité (effet sur tout le génome), homogamie (crée un déficit en
hétérozygotes au(x) locus concerné(s)),.
•
L’hétérogamie, régime de reproduction ouvert, implique une forme de sélection qui
avantage les allèles rares au(x) locus contrôlant l'hétérogamie.
•
S'il n'y a pas de sélection associée, le changement de régime de reproduction modifie la
structure génotypique mais ne modifie pas les fréquences alléliques.
•
Suivant les locus ou les caractères étudiés, on pourra conclure dans une même population
à des conclusions différentes quant au régime de reproduction auquel chacun des
caractères étudiés est soumis. Par exemple dans de nombreuses populations humaines on
ne peut pas rejeter l’hypothèse de panmixie pour les groupes sanguins (A, B, O ou M,N),
la taille est souvent soumise à un régime à tendance homogame alors qu’il y a
hétérogamie obligatoire pour le sexe.
Pages correspondantes du polycopié, à lire: p.8-10 (hormis l'encadré 3); 11-13.
Génétique des populations - 1ère année AgroParisTech – 10/2016
7
Les pressions évolutives définitions :
Une pression évolutive est, par définition, un processus qui entraîne des variations de
fréquences alléliques. Il existe quatre pressions évolutives : la sélection, la migration, la
mutation, et la dérive génétique.
•
On dit qu'il y a sélection si, dans des conditions de milieu données, certains génotypes
survivent et se reproduisent mieux que d'autres. On peut quantifier la sélection par les
valeurs sélectives des différents génotypes (traditionnellement notées w). La valeur
sélective d'un génotype est le nombre espéré de descendants qu’il produit par génération.
Cela intègre la probabilité de survie des individus du génotype considéré (leur viabilité) et
leur fertilité. Comme seuls importent, pour l’évolution des fréquences alléliques, les
rapports entre les valeurs sélectives des divers génotypes, on utilise souvent, en pratique,
des valeurs sélectives relatives : rapport de la valeur sélective du génotype considéré à
celle d’un génotype pris comme référence (qui a alors la valeur sélective relative de 1).
•
La migration, correspond à des échanges génétiques entre populations. L'immigration à
partir de populations ayant une composition génétique différente entraîne un changement
des fréquences alléliques dans la population receveuse. Le taux de migration (par
génération) correspond à la probabilité qu'un gamète ou un individu dans une population
donnée soit un immigrant.
•
La mutation est la transformation "accidentelle" d'un gène en un autre. Le taux de
mutation (par génération) de l'allèle A1 en l'allèle A2 est la probabilité qu'un gène A1 se
transforme en gène A2.
•
La dérive génétique se définit comme la variation aléatoire des fréquences alléliques
d'une génération à l'autre dû à l'effectif fini de la population : de ce fait, chaque génération
est un échantillon ne reflétant pas forcément exactement la composition espérée par la loi
des grands nombres.
Génétique des populations - 1ère année AgroParisTech – 10/2016
8
SEANCE N° 3
Sélection et dérive
Parmi les pressions évolutives, nous allons explorer plus particulièrement les effets de la
sélection et de la dérive génétique sur l'évolution des fréquences alléliques, grâce au
programme Populus.
1. Evolution des fréquences alléliques dans une population diploïde sous l'effet de la
sélection :
Ouvrir Populus sous windows, puis dans l’onglet "Model" choisir "Natural Selection" puis
"Selection on a Diallelic Autosomal Locus".
La fenêtre de dialogue suivante apparaît :
Ce module calcule, de façon déterministe, l'évolution des fréquences alléliques sous l'effet de
la sélection (avec des valeurs sélectives que l'on choisit) dans une population panmictique
diploïde de taille infinie.
Génétique des populations - 1ère année AgroParisTech – 10/2016
9
Choisir les paramètres suivants : graphe "p vs t" (c.à.d. affichage de l'évolution de la
fréquence allélique p en fonction du nombre t de générations de sélection) ; "Fitness" pour
utiliser des valeurs sélectives relatives (cf. définition page ci-contre) :
wAA, wAa, waa (valeurs à choisir selon le tableau ci-dessous, par exemple 1, 0.9 et 0.8) ; vous
choisirez d'abord "One Initial Frequency" et, dans ce cas, il faut choisir une fréquence de
départ pour A (0.01 par ex.); on pourra choisir ensuite d'autres valeurs ou bien utiliser "Six
Initial Frequencies" (le programme choisit alors pour vous six fréquences initiales et affiche
les six courbes à la fois; les fréquences choisies sont 0.02, 0.2, 0.4, 0.6, 0.8, et 0.98). Enfin
sélectionner le nombre de générations pendant lequel la population va évoluer
"Generations=200".
Quand vous avez choisi ces options, lancez la simulation grâce au bouton "View"
.
Vous obtiendrez alors le graphe de l'évolution de la fréquence p de l'allèle A au fil des
générations (t). Redimensionnez la fenêtre de sortie en fonction de votre écran, mais veillez à
ne pas occulter la boîte de dialogue. Pour une meilleure visualisation des fréquences au cours
du temps utiliser le bouton "Options" en haut à gauche de la fenêtre de sortie et choisir
"FinerGrid".
Après avoir fait varier les valeurs sélectives relatives et les fréquences initiales, comme
proposé dans le tableau ci-contre, répondre aux questions suivantes :
- Quel est l'effet de l'ampleur des différences entre valeurs sélectives relatives ? (comparer
les cas 1 et 2)
- Quel est le devenir de l'allèle favorable (comparer les cas 1 et 3) ?
- Quels sont les états d'équilibres possibles ? (ensemble des cas 1 à 5, en utilisant "sixfrequency")
- Quelle est l’influence de la dominance ou de la récessivité pour la valeur sélective ? (cas
6,7 et 8) Comment peut-on expliquer cela ?
Génétique des populations - 1ère année AgroParisTech – 10/2016
10
ex. de choix de val. sélectives
cas
wAA
Allèle A favorable
(1)
Allèle A favorable
(2)
Allèle a favorable
(3)
bis
bis
(1 , 3 )
1
0.9
0.8
1
0.7
0.4
0.8
0.9
1
Refaire (1) et (3) avec
0.9
1
0.8
1
0.8
0.9
1
1
0.9
wAa
choix conseillés pour une bonne
visualisation
waa
fréq. initales
One frequency (0.01)
Idem
One frequency (0.99)
Six frequencies
Six frequencies
Six frequencies
One frequency (0.01)
(4)
(5)
(6)
Superdominance
Sous-dominance
A favorable dominant
(7)
A favorable récessif
1
0.9
0.9
One frequency (0.01)
(8)
a favorable dominant
0.9
1
1
One frequency (0.99)
Fermer la fenêtre de dialogue (bouton
t
200
200
200
200
200
200
200
200
puis
1000
200
) avant de passer à la deuxième partie du TD.
2. Evolution des fréquences alléliques dans une population de taille finie
Dans l’onglet "Model" choisir "Mendelian Genetics" puis "Genetic Drift".
Le programme simule ici une population panmictique diploïde de taille N finie, constante.
Chaque génération successive est constituée par tirage au hasard de 2N gamètes produits par
la génération précédente, qui sont ensuite unis au hasard (panmixie) pour former les N
individus de cette nouvelle génération. Si la fréquence de l'allèle A dans la génération
parentale est p, chacun des 2N gamètes tirés au hasard pour former la génération suivante a
une probabilité p d'être A et q=(1-p) d'être a. (C'est comme si on tirait au hasard 2N boules
dans une urne infinie contenant des boules noires et blanches en proportions p et q...).
a) Dans la fenêtre de dialogue choisir l’option "Monte-Carlo" ; dans la fenêtre "Runtime"
cliquer sur Other et fixer à 50" le nombre de générations à simuler ; choisir ensuite
"Population Size (N) = 20" ; "Number of Loci = 6" (à voir ici comme 6 populations
différentes) ; "Initial Frequency = 0.5". Les fréquences de départ de l’allèle A seront fixées
collectivement à p0=0.5 (les 6 populations ont la même fréquence initiale de A).
Lancer la simulation avec le bouton
et faire plusieurs répétitions grâce au bouton
de la fenêtre de sortie. Décrire l'évolution des fréquences alléliques au cours du
temps.
Voyez-vous pourquoi elles évoluent ?
b) Refaire des simulations en changeant la taille de la population, N=50, puis N=200.
Que se passe-t-il lorsque la taille de la population augmente ?
c) Choisir les paramètres suivants : taille de la population N=20; nombre de générations à
simuler (Runtime) t=150. Faire varier la fréquence de départ de l'allèle A (p0=0.1, p0=0.5,
p0=0.9), et regarder le nombre de fois où l'allèle A se fixe, et le nombre de fois où c'est l'allèle
a qui se fixe. Faire plusieurs répétitions (au moins deux) pour chaque jeu de paramètres.
Que constatez-vous ?
Génétique des populations - 1ère année AgroParisTech – 10/2016
11
Tiré de « Principles of Population Genetics », D.L. Hartl et A.G. Clark, 1989, Sinauer Ass.
Génétique des populations - 1ère année AgroParisTech – 10/2016
12
3. La dérive génétique, modèle à nombre infini de populations
Revenir à la fenêtre de dialogue et choisir cette fois l’onglet "Markov".
Ce module calcule, de façon déterministe, la distribution de la fréquence d’un allèle dans une
infinité de populations diploïdes de taille finie, se trouvant toutes dans le même état initial et
dérivant toutes en même temps. L'affichage donne, génération après génération, la proportion
des populations ayant chaque fréquence allélique possible (avec 10 individus, donc 20 gènes,
il existe 21 fréquences alléliques possibles pour A: p=0.00, 0.05, 0.10, 0.15, ... jusque 1.00).
Fixer le nombre de gènes A par population à 10 et le nombre d'individus par population
(Population Size) à 10. Ce qui fixe la fréquence initiale p0= 0.5, car 10 individus = 20 gènes.
a) Cliquer sur
, puis cliquer une fois sur
. Quelle est l'allure de la distribution de
probabilité après une génération, après quelques générations, après un grand nombre de
générations (cliquer à répétition sur
pour faire défiler les générations) ?
b) Refaire la simulation pour 2 gènes A (ce qui correspond à p0=0.1).
c) Comment évoluent dans les deux cas la fréquence allélique moyenne et la variance des
fréquences alléliques ?
Fermer la fenêtre de dialogue (bouton
) avant de passer à la 4ème partie du TD.
4. Dérive génétique et sélection
Sous l’onglet "Model" choisir "Mendelian Genetics" puis "Drift and Selection". Ce
module simule une population de taille finie, soumise à la sélection naturelle.
a) Choisir les paramètres suivants : taille de la population (N) = 100 individus; fréquence
initiale de l'allèle A : p0=0.1; valeurs sélectives relatives wAA=1, wAa=0.95, waa=0.9; nombre
de générations à afficher = 500.
(Rem.: en fait, ici, le programme affiche juste le nombre de générations nécessaire jusqu'à la
fixation. L'échelle des abscisses change donc à chaque simulation.)
Lancer plusieurs simulations avec le même jeu de paramètres (utiliser la touche
dans la
fenêtre de dialogue), changer la taille de la population (N)=20 individus et lancer plusieurs
simulations.
Que peut-on conclure concernant les effets conjoints de la dérive génétique et de la sélection ?
b) En prenant N = 500 individus (1000 gènes), prendre p0=0.001 pour simuler l'apparition d'un
gène favorable par mutation (1 gène muté apparu parmi les 1000 gènes de la population).
Considérez que la mutation est favorable (valeurs sélectives 1, 0.95, 0.9). Faites une série de
simulations.
Qu'en concluez-vous ?
Quittez le programme Populus avec le bouton Quit:
Génétique des populations - 1ère année AgroParisTech – 10/2016
13
Figure 5 : Evolution de la fréquence du gène de coloration (black+ = allèle sauvage) chez le
ver de farine (Tribolium castaneum) dans deux séries de 12 populations, avec des effectifs par
génération de N=10 et N=100, respectivement (d’après Rich et al, 1979). Les hétérozygotes
sont reconnaissables.
Génétique des populations - 1ère année AgroParisTech – 10/2016
14
On retiendra :
•
La sélection entraîne des variations systématiques des fréquences alléliques. Agissant
seule, elle aboutit in fine à l'élimination de l'allèle défavorable et la fixation de l'allèle le
favorable (on dit qu'un allèle est "fixé" quand il atteint une fréquence de 1), à une vitesse
qui dépend de l'ampleur des différences entre valeurs sélectives des divers génotypes, et
aussi beaucoup des relations de dominance/récessivité (c.à.d. où se situe la valeur
sélective des hétérozygotes par rapport à celle des homozygotes).
Si la valeur sélective des hétérozygotes est supérieure à celle des deux homozygotes, les
deux allèles se maintiennent indéfiniment à une fréquence d'équilibre non nulle.
•
La dérive génétique est un processus aléatoire à l’œuvre dans les populations de taille
finie. Il consiste en l’échantillonnage au hasard des gamètes ou des porteurs de gamètes
lors du passage d’une génération à la suivante.
En l’absence d’autres pressions évolutives, en population finie, les fréquences des allèles
fluctuent aléatoirement d’une génération à l’autre. Le seul état d’équilibre en l’absence de
mutation est la fixation d’un allèle.
•
Dérive génétique et sélection : Dans une population de petite taille, même un allèle
défavorable peut se fixer par hasard, et cela d’autant plus facilement que le désavantage
sélectif qu’il induit est petit.
•
Dans une population finie, une mutation nouvellement apparue, même avantageuse, a une
forte probabilité d'être perdue.
Pages correspondantes du polycopié: p.16-19 (pour la dérive); 21-24 (pour la sélection)
Génétique des populations - 1ère année AgroParisTech – 10/2016
15
SEANCE N° 4 :
Mutations contre sélection :
Le cryptopolymorphisme
Qui est porteur de gènes létaux ?
Il se produit sans cesse des mutations. Certaines mutations sont sélectivement neutres, c'est-àdire n'ont aucune influence perceptible sur le bon fonctionnement du gène et donc sur la
viabilité et la fertilité des individus qui la portent. Souvent, cependant, les mutations
produisent des gènes défectueux. La sélection tend à les éliminer, mais il y a sans cesse des
mutations qui réintroduisent ces allèles dans la population. Cette situation permet de
comprendre la fréquence des maladies génétiques.
Excercice I :
On considère, dans l'espèce humaine, un locus où l'allèle A peut muter à chaque génération en
une forme a, avec une probabilité u (le "taux de mutation" de A en a; typiquement de l'ordre
de u = 10-5 ou 10-6). Autrement dit, parmi les gamètes produits par la population, une
proportion u des gamètes qui auraient été normalement A sont transformés, "mutés", en
gamètes a.
On suppose que cette mutation n'a aucune influence sur la viabilité ou la fertilité des individus
qui la portent, que ce soit à l'état homozygote ou hétérozygote (pas de sélection). On suppose
aussi qu'il n'y a pas de migration et que la population est infinie (pourquoi ?)
1. Si on part d'une fréquence p0 de A et q0 = 1 – p0 de a, quelles seront les fréquences p1 et
q1 de A et de a à la génération suivante, en fonction des fréquences initiales et de u ?
2. Quelle sera la fréquence pn de A au bout de n générations ?
3. Avec u = 10-5, combien faudra-t-il de générations pour que la fréquence initiale du gène A
soit diminuée de moitié ?
En prenant une durée de génération de 25 ans, combien de temps cela représente-t-il ?
Qu'en concluez-vous ?
Excercice II :
La maladie de Tay-Sachs est une maladie génétique due à une déficience d’une enzyme
lysosomale (l’hexosaminase A) qui normalement catalyse l’hydrolyse d’un glycolipide
abondant dans les membranes des neurones (le ganglioside GM2). Le nouveau-né atteint de
cette maladie est normal, mais vers l’âge de 6 mois, apparaissent les premiers signes d’une
dégénérescence progressive du tissu nerveux : paralysie croissante, cécité progressive, retards
psychiques... Les enfants atteints meurent vers l’âge de 4 à 5 ans. Il y a autant de garçons que
de filles atteints par cette maladie. En Europe, il naît environ un enfant atteint pour 250 000
naissances.
1) Evaluer la fréquence de l'allèle responsable de la maladie, en supposant qu’il est dominant
sur l’allèle normal, puis en supposant qu’il est récessif. Préciser et discuter les hypothèses
nécessaires aux calculs.
Génétique des populations - 1ère année AgroParisTech – 10/2016
16
2) Dans les deux hypothèses (dominance ou récessivité), évaluer le taux de mutation qui
amène à la fréquence observée de la maladie.
3) Une étude suédoise a montré que parmi les enfants atteints, environ 15 % étaient issus
d’unions entre cousins germains, alors que la fréquence de ces unions n’était que de 5 pour
1000 dans la population étudiée. Cela permet-il de trancher sur la dominance ou la récessivité
du gène ?
III. Quelle est la réponse à la question du titre ?
On retiendra :
•
Les mutations font apparaître de nouveaux allèles dans une population. Cependant, en
l’absence de toute autre pression évolutive, un allèle produit par des mutations survenant
de façon récurrente met un temps très long à envahir la population.
•
Si la mutation est sélectivement neutre, dans une population non-infinie, c'est la dérive
génétique qui déterminera le devenir d'une nouvelle mutation. Comme celle-ci est en
fréquence très faible lorsqu'elle apparaît (1 gène sur 2N), elle est très souvent perdue, mais
le cas inverse où elle envahit la population peut survenir (avec une probabilité égale à la
fréquence initiale 1/2N : cf. TD 3). Dans une population finie, la perte d'un nouvel allèle
apparu par mutation peut survenir aussi dans les premières générations suivant son
apparition, même si le nouvel allèle est favorisé par la sélection.
•
La sélection peut permettre une croissance rapide, comparativement, de la fréquence d’un
allèle favorable, c’est à dire conférant un avantage sélectif aux individus qui l'expriment,
même si cet avantage sélectif semble faible. En résumé, « la mutation propose, la sélection
dispose ».
•
Toutefois, lorsque l'allèle défavorable est récessif, et l'allèle favorable dominant, la
fixation complète de l'allèle favorable par sélection ne se fait que très lentement (cf. TD 3
sur Populus) : lorsqu'il est rare, l'allèle défavorable récessif est difficilement éliminé dans
une population panmictique, car il est essentiellement chez des hétérozygotes (2pq >> q2
quand q est faible), où il est "masqué".
•
Par conséquent, du fait de mutations récurrentes produisant des allèles défectueux
récessifs, il s'établit un équilibre "mutation contre sélection" aboutissant à une fréquence
de l'allèle délétère qui n'est pas tout à fait négligeable.
•
Plus précisément, pour un locus biallélique dans une population panmictique, si les
valeurs sélectives relatives des trois génotypes AA, Aa et aa valent 1, 1, et 1-s
respectivement, avec 0 < s ≤ 1 (s est le désavantage sélectif des individus aa), et si l’allèle
a apparaît par mutation avec la probabilité u à chaque génération, la fréquence d'équilibre
de l’allèle délétère récessif vaut q= us . La fréquence attendue des individus atteints est
u
q2 =
s.
Pages correspondantes du polycopié: p.24-25 (mutation); 36-42 (cryptopolymorphisme)
Génétique des populations - 1ère année AgroParisTech – 10/2016
17
L'anémie falciforme à travers quelques extraits d'articles
(1) Extrait de La Recherche, Juillet-Aout 1981, n° 124, article de Gilles Sauclières.
"L’anémie falciforme est une maladie héréditaire grave, souvent mortelle, toujours
handicapante, que l’on observe surtout parmi les populations noires africaines et
américaines. [...] Ce qui domine dans cette maladie, ce sont des crises douloureuses, liées à
l’arrêt de la circulation du sang dans certains organes, responsables indirects d’une mort qui
survient, en général à l’adolescence. [...] Les globules rouges des malades [...] contiennent
une hémoglobine légèrement différente de la normale (appelée HbS), dont les deux chaînes α
sont normales, mais dont les chaines β (βS) diffèrent de la chaîne β normale (βA) par le
remplacement d’un acide aminé, l’acide glutamique (en position 6 dans la séquence
normale), par la valine."
(2) Extrait de Pour la Science, Octobre 1981, article de M. Friedman et W. Trager
"Les symptômes de la maladie se manifestent lorsque les globules rouges SS
abandonnent leur oxygène au niveau des tissus. Quand l’hémoglobine S est réduite, elle
s’agrège en fibres longues et minces ; les globules se déforment et [...] adoptent fréquemment
une forme caractéristique en faucille [...]. Lors d’une crise, les cellules falciformes bloquent
la circulation sanguine locale ; cela entraîne une baisse supplémentaire de la quantité
d’oxygène disponible, un accroissement du nombre de cellules déformées et l’apparition
d’importantes zones nécrosées. En l’absence d’un traitement médical très sévère, les chances
de survie des sujets SS sont extrêmement faibles. Les individus hétérozygotes ne sont
généralement pas atteints : leurs globules rouges AS renferment suffisamment d’hémoglobine
normale, ainsi la déformation n’intervient-elle que dans des conditions extrêmes, par exemple
à haute altitude."
"C’est en observant la répartition géographique du paludisme et de l’anémie à hématies
falciformes que nous avons été conduits à penser que la mutation associée à cette maladie
génétique pouvait conférer une certaine résistance au paludisme. Les preuves cliniques furent
plus difficiles à rassembler mais, en 1954, Anthony Allison [...] constata que des enfants
hétérozygotes pour le gène [...] étaient moins gravement touchés par le paludisme. L’une des
indications les plus nettes de l’effet protecteur que joue le gène de l’anémie à hématies
falciformes est que très peu de porteurs meurent de complication cérébrales lorsqu’ils sont
atteints de paludisme à Plasmodium falciparum."
(3) Extrait d’un article du Monde du 20 Août 1975, par le professeur Jean Rosa
"L’incidence de la tare* est exceptionnellement élevée. Le nombre de porteurs dépasse
12% de la population noire aux Etats-Unis [...]. En Afrique [en zones équatoriales, tropicales
humides et en bordures maritimes], l’incidence oscille entre 18 et 40% suivant les territoires.
[...] Il s'agit sans conteste de la tare morbide la plus fréquente de par le monde."
[* Rem.: le terme de "tare" était naguère celui couramment utilisé en médecine pour désigner une maladie
génétique. Du fait de la connotation péjorative qu'il a dans le langage courant, ce terme n'est plus guère
utilisé de nos jours.]
"La situation en Martinique, en Guadeloupe et à la Réunion est particulièrement
préoccupante. La population de ces territoires est d’origine noire dans sa très grande
majorité. L’insularité favorise tout naturellement la progression des tares par le phénomène
bien évident de l’endogamie (unions se produisant dans des populations de taille limitée avec
relativement peu d’apport ethnique venant de l’extérieur). [...] Aucun conseil génétique n’a
été établi. Seules des enquêtes fragmentaires ont eu lieu, qui ont montré que l’incidence de la
tare [fréquence des porteurs] devait être comprise entre 8 et 12%."
Génétique des populations - 1ère année AgroParisTech – 10/2016
18
SEANCE N° 5 :
Le polymorphisme
Pourquoi sommes-nous tous différents ?
La sélection tend à fixer l'allèle le plus favorable et à éliminer les allèles défavorables. Ces
derniers ne peuvent se maintenir que parce que des mutations les réintroduisent, mais ils
restent toujours en fréquence très faible. C'est la situation que nous avons vu précédemment
("cryptopolymorphisme", TD4). D'un autre côté, si la sélection n'intervient pas (allèles
sélectivement neutres), nous avons vu que la dérive devait, elle aussi, aboutir à fixer un allèle
et à ce que les autres soient perdus (TD3). Or tout cela ne correspond pas à la structure de la
variabilité génétique qu'on observe dans les populations de presque toutes les espèces: au
contraire, pour la plupart des gènes, coexistent dans les populations plusieurs allèles en
fréquence du même ordre de grandeur, situation que l'on nomme polymorphisme génétique :
par exemple, chez l'homme, les groupes sanguins, la couleur des yeux et toute la variation
phénotypique "courante", ainsi que le polymorphisme pour de nombreux marqueurs
moléculaires.
Comment expliquer ce paradoxe ? Plusieurs explications ont été avancées. L'une des
premières qui fut proposée est que la sélection agit de façon telle qu'elle favorise le maintien
de plusieurs allèles. Un cas célèbre et bien connu est celui de l'anémie falciforme rappelé cicontre.
Exercice :
1) Dans l'extrait d'article (3), il est indiqué qu'en Afrique noire, la fréquence des porteurs
"oscille entre 18 et 40% suivant les territoires". Calculer la fréquence de l'allèle S dans une
population africaine d'adultes avec 30% de porteurs (on admettra que tous les enfants atteints
meurent avant d'atteindre l'âge adulte, ce qui était le cas jusqu'à une période récente).
2) Expliquez la fréquence élevée du gène S en Afrique.
Estimez les valeurs sélectives relatives des trois génotypes en Afrique (toujours en supposant
une fréquence de 30% de porteurs). Précisez les hypothèses faites.
3) Pour la population noire des Etats-Unis (12% de porteurs selon (3)), calculez la fréquence
de l'allèle S. Comment expliquez-vous cette fréquence ?
4) Que pensez-vous de l'affirmation de l'article (3) selon laquelle "L’insularité favorise tout
naturellement la progression des tares par le phénomène bien évident de l’endogamie (unions
se produisant dans des populations de taille limitée avec relativement peu d’apport ethnique
venant de l’extérieur)." ?
La supériorité des hétérozygotes ("superdominance") a été un temps considérée comme
pouvant expliquer la plupart des polymorphismes observés. Mais...
Génétique des populations - 1ère année AgroParisTech – 10/2016
19
On retiendra :
•
Si les valeurs sélectives génotypiques sont constantes, le seul cas où un polymorphisme
sélectionné peut s’établir et se maintenir correspond à la superdominance (les
hétérozygotes ont une valeur sélective supérieure à celle des homozygotes).
•
Mais il est peu probable que la superdominance soit impliquée dans beaucoup de cas de
polymorphismes...
D'autres types de sélection :
•
La variabilité des valeurs sélectives dans l’espace et dans le temps permet le maintien
d’une diversité sélectionnée, sans qu’il y ait nécessité de superdominance, et cela pourrait
être une explication plus générale aux nombreux polymorphismes observés.
•
La sélection fréquence-dépendante ("avantage du rare") peut jouer aussi un rôle.
Dérive génétique et mutations neutres :
•
Le jeu combiné des deux peut suffire à expliquer l'existence du polymorphisme, sans faire
appel à aucune espèce de sélection. Cette explication "neutraliste" du polymorphisme est
notamment invoquée pour une grande part du polymorphisme observé au niveau de l'ADN
ou des protéines.
•
Le nombre de différences entre deux séquences homologues d’ADN trouvées chez deux
espèces différentes dépend du temps de divergence entre les espèces et du taux de
mutation neutre (non soumises à la sélection). On constate empiriquement qu’en général,
pour un gène donné, ces mutations s’accumulent à un rythme à peu près constant chez
toutes les espèces. C’est l’horloge moléculaire qui, une fois calibrée, permet de
déterminer le temps qui sépare deux espèces de leur dernier ancêtre commun.
•
Les séquences d'ADN ou de protéines enregistrent donc l'apparentement entre les espèces.
Cela fournit un outil puissant pour reconstituer les phylogénies.
Pages correspondantes du polycopié: p.22-23 (sélection: révision); 46-57
Génétique des populations - 1ère année AgroParisTech – 10/2016
20
Téléchargement