Génétique des populations
Références :
Précis de génétique de population (Henri et Gouyon)
Introduction to population genetics (Hulliburton)
I] Introduction
1) Qu'est-ce que la génétique de populations
Génétique appliquée à l'ensemble d'une population. C'est l'étude et la prédiction de la transmission de la diversité génétique
dans une population. Les applications se retrouvent notamment dans la médecine et l'étude des maladies génétiques,
l'amélioration génétique (végétal, animal), l'écologie et la biologie de conservation, la théorie de la génétique des populations.
Vocabulaire :
Gène : C'est unité d'information dont la séquence est portée par une macromolécule transmise telle qu'elle à la
génération suivante.
Locus : L'emplacement du gène sur le chromosome.
Allèles : Version d'un gène
Homozygote : deux fois le même allèle pour un gène donné
Hétérozygote : deux allèles différents d'un même gène
Ploïdie : nombre de jeux de chromosomes homologues qui constituent son génome. Haploïde (n), Diploïde (2n),
Tétraploïde (4n).
Dominant : Allèle s'exprimant au niveau phénotypique chez l'hétérozygote
Récessif : Allèle ne s'exprimant pas forcément phénotypiquement
Avantageux : Allèle permettant de laisser plus de descendants à la génération suivante
Délétère : Allèle laissant moins de descendants
Neutre (vis avis de la sélection) : Aucune influence sur le nombre de descendants.
Fréquence : nombre d'un même allèle dans une population, liée à la probabilité de transmission.
Population : Ensemble d'individus d'une même espèce ayant une forte probabilité de se reproduire entre eux. Selon
l'espèce, l'étendu de la population peut varier
Espèce : Ensemble d'individus potentiellement inter féconds.
Pool génétique : L'ensemble de la diversité contenue dans une population (allèles et fréquences associées). Le pool
génétique varie donc d'une population à l'autre.
Prenons deux populations diploïdes bi-alléliques : le contenu génétique des deux populations est différents, mais il est
potentiellement possible qu'il y ait croisement entre ces deux populations. Cela nécessite une migration, dont on étudie la
probabilité.
Pour étudier alors la reproduction entre deux populations, on étudie « l'urne gamétique », qui est constituée de l'ensemble des
gamètes mâles et femelles d'une population possibles (deux dans ce cas). On tire alors au sort deux gamètes pour former un
individus. On obtient une population de zygotes dont une partie deviendra ensuite adulte reproducteur.
Chaque étape devra être étudiée (probabilité de formation de couples, au hasard ou non, probabilité de formation de gamètes et
de survie des zygotes...).
2) Formaliser l'évolution
La compréhension de l'évolution repose sur la théorie Darwinienne de l'évolution par sélection naturelle. Pour qu'une
population évolue, il faut qu'elle soit polymorphe (génétiquement diversifiée). Le milieu ne peut qu'augmenter le taux de
mutation, mais ce phénomène reste aléatoire.
On aura sélection naturelle quand la probabilité de laisser un descendant dépend du génotype : ainsi, à chaque génération, la
fréquence de gène avantageux augmentera, alors que les autres allèles disparaitront. On dit que le gène arrive à fixation, car au
bout d'un certain temps, tous les individus deviennent homozygotes pour ce gène, et donc la fréquence ne variera plus d'une
population à l'autre.
Cependant, il ne faut pas négliger le hasard. En effet, d'une génération à l'autre, le contenu d'une urne gamétique peut varier par
hasard. On parle de dérive génétique, qui est une évolution seulement due au hasard. La dérive amène également à la perte de
polymorphisme.
La sélection des gamètes est également un moteur de l'évolution (par sélection du partenaire).
II] La variabilité
De base, dans une population, la variabilité génétique est assez élevé, même chez les bactéries, à cause des mutations
spontanées.
Variabilité morphologique, mais cette dernière est soumise à l'environnement, qui peut la modeler. Deux plantes
génétiquement identiques pourront avoir des morphologies différentes selon le milieu.
Variabilité chromosomique, comme l'ordre des gènes, scission ou fusion chromosomique, position du centromère :
télocentrique (au bout), acrocentrique (tailles inégales de part et d'autre du télomère), métacentrique (au milieu).
Variabilité comportementale
Variabilité physiologique, qui correspond aux différences de fonctionnement de l'organisme
Variabilité biochimique, quand les protéines n'ont pas la même fonction
Variabilité moléculaire, avec des différences au niveau des protéines et ADN
La variabilité peut également être corrélé à l'emplacement géographique d'une population, comme en Europe du sud, la
population humaine perd la capacité de digérer le lactose. Certains caractères génétiques ne sont pas soumis à l'hérédité
Mendélienne, comme l’ADN des mitochondries.
La source de la variabilité génétique est la mutation, qui est un phénomène totalement aléatoire, et qui n'est en aucun cas
influencé par l'environnement (qui n'augmente que la fréquence de mutation). Ces mutations se font sur l’ADN, par
substitution (remplacement d'une base), délétion (perte d'un ou plusieurs bases) ou insertion (addition d'une, mais plus
généralement plusieurs bases). Les mutations peuvent être :
Silencieuse (sans phénotype, donc non soumise à la sélection),
Non silencieuse neutre (n'influe pas sur le nombre de descendants)
Non silencieuse avantageuse/délétère
Non silencieuse létale
Un phénotype n'est cependant pas uniquement au gène, mais est le fruit d'une interaction entre le gène et l'environnement.
Selon le gène, l'interaction avec l'environnement aura plus ou moins d'effet sur le phénotype. C'est le cas apr exemple d'un
gène de résistance à un insecticide, qui sera avantageux en présence de cet insecticide, mais délétère si le milieu n'en contient,
à cause du coup énergétique de la résistance.
Taux de polymorphise :
P=nombre gènes polymorphes
nombre total de gènes étudié
Un gène est dit polymorphe si il a au moins
deux allèles, et dont l'allèle le plus fréquent l'est à moins de 95% (ou 99%). Si l'allèle principale se
retrouve à une fréquence supérieur à 95% (ou 99%), on parle de cryptopolymorphisme.
Taux d'hétérozygotie : moyenne des fréquences des hétérozygotes à chacun des loci observé étudiés.
HO=1
n
i=1
n
Hi
.
La moyenne d'hétérozygotie chez l'humain pour l'ensemble des enzymes est de 0,067. Chez les hymenoptères, le taux est plus
faibles (mâles haploïde chez les abeilles), pareil pour les population à petit nombre d'individus (moins de chance de mutation,
donc moins de chances d'hétérozygotie). Chez les guépards, la population est devenue tellement réduite que les individus sont
presques tous homozygotes (HO = 0,0004).
Diversité génétique :
He=N
N11
i=1
i=n
Pi²
N taille de l'échantillon, n nombre d'allèles, Pi la fréquence de l'allèle.
Probabilité d'avoir deux allèles différents dans un même locus, lorsque ces deux allèles sont pris au hasard dans une
population.
Diversité nucléotidique
: probabilité de tirer deux nucléotides différents au même endroit dans une séquence donnée.
III] Le modèle de Hardy-Weinberg
1) Constitution génétique d'une population
On considère un gène di-allélique A et B de fréquences p et q, et une population à N individus non chevauchante (l'individu
meurt après reproduction.
La population étudiée est dite « idéale »
sans sélection,
effectif infini,
sans mutations,
Panmixie (pas de choix du partenaire),
Isolée (sans migration), Pas de distorsion ou ségrégation méiotique.
On a
p=nA
2N ;q=nB
2N :pq=1
.
Gamète
Gn
zygote
Gn1
Reproducteur
Gn1
Gamètes
Gn1
Trois génotypes possibles : AA (p²), BB (q²) et AB (2pq).
2pq=pq²=1
. Comme la population est
infinie, sans dérive et sans sélection, la composition génétique d'une génération est identique à la génération précédente.
Une population idéale est donc à l'équilibre, les fréquences alléliques restent les même d'une génération à l'autre. On parle de
l'équilibre d'Hardy-Weinberg. Si une population évolue, et change de contenu d'une génération à l'autre, c'est qu'au moins une
des règles de la population idéale n'est pas respectée.
2) L'équilibre d'Hardy-Weinberg
Gamètes Zygote Reproducteurs Gamètes
A(p)
B(q)
p + q = 1
Dérive
Panmixie
AA (p²)
AB (2pq)
BB (q²)
Sélection
Migration
AA (p²)
AB (2pq)
BB (q²)
Sélection
Distorsion et
ségrégation
méiotique
A (p² + pq = p)
B (q²+pq =q)
Test d'équilibre d'Hardy-Weinberg :
Constitution phénotypique
Constitution génotypique
Constitution allélique
a) Focus diallélique codominant
Soit une population de N individus, avec trois génotypes (AA, AB, BB), trois phénotypes ([1], [2], [3] d'effectif
n1, n2, n3
).
Comme on est dans un locus codominant, il suffit de compter les phénotypes pour avoir les génotypes.
f[1]= n1
N=fAA
, et
.
Allèles :
p=fA=2n1n2
2N =2n1
2N n2
2N =fAA 1
2fAB
La fréquence d'un allèle est donc toujours égale à la fréquence des homozygote + la moitié de la fréquence des hétérozygotes.
Exemple : Les groupes sanguins M,N (Aborigènes australiens)
Phénotype [M] [MN] [N]
Génotype MM MN NN
Effectif 22 213 492
Fréquence 22/730 = 0,03 216/730 = 0,3 492/730 = 0,67
Effectif attendu si H0
×N=23,65
2pq×N=215,5
×N=490,85
fM= p=fMM  1
2fMN =0,031
20,3=0 ,18
Et
fN=q=fNN  1
2fMN =0,82
On veut vérifier si la population est à l'équilibre d'Hardy-Weinberg :
On pose l'hypothèse :
H0=la population est à l ' équilibre d ' HardyWeinberg
Si la population est à l'équilibre, alors
fMM = p² , f NN =qq² , f MN =2pq
Les populations attendues sont proches des populations observées. Cela peut être à une hypothèse fausse, mais également
au fait que l'on a pris un échantillon de la population (erreur d’échantillonnage). L'écart entre observé et attendu est-il
suffisamment faible pour valider ou non H0.
On fait un test de « Khi carré »
²
X²=effectif observéeffectif attendu ²
effectif attendu =2223,65²
23,65 216215,5²
215,5 492490,85²
490,85 =0,118
Si H0 est vraie,
X²
suit une loi théorique de
²
avec pour paramètres :
α = 5% (5% de chance de rejeter l'hypothèse vraie, avec un risque d'accepter une hypothèse fausse quasi nul).
Nombre de degrés de liberté : ddl = nb de comparaisons 1 nb de paramètres indépendants estimés sur les
observés nécessaire au calcul des attendus.
Ici :
ddl=3nombre d ' éléments comparés−11car p et q sont interdépendants
, et d'après les
tables de valeurs :
²=3,841
 ²
donc la théorie est possible.
b) Focus allélique dominant (A>B)
Une population à N individus, avec 3 génotypes (AA, AB, BB) et deux phénotypes ([1] et [2] d'effectif
n1et n2
).
On ne peut calculer aucune fréquence allélique, puisqu'on ne connait pas la proportion d'hétérozygote et on ne peut savoir si la
population est à l'équilibre d'Hardy-Weinberg.
Si on suppose qu'une population est à l'équilibre d'Hardy-Weinberg (donc avec des fréquence p², 2pq et q²) on peut retrouver la
fréquence du phénotype récessif :
f[2]= fBB= n2
N=q=
n2
N
, et donc on pourra retrouver p.
c) Trois allèles codominants A,B,C
Trois allèles A,B,C de fréquences p,q,r.
pqr=1
et donc 6 génotypes : AA, AB, BB, BC, CC, AC.
p=fAA 1
2fAB1
2fAC
On retrouve les proportions d'Hardy-Weinberg :
AA, q² BB,CC ,2pq AB,2pr AC ,2qr BC
.
d) Gène lié au sexe
X
pA, X
qB
donnent 5 génotypes :
XAY , X BY
pour les mâles et
XAXA, X AXB, X BXB
pour les femelles.
Pour les mâles :
p=fXAYet q=fXBY
Soit les proportions d'Hardy-Weinberg : p² et q²
Pour les femelles :
p=fXAXA, q ♀=fXBXB
soit les proportions d'Hardy-Weinberg : p², 2pq, q².
Si on est à l'équilibre d'Hardy-Weinberg, on a :
p=p
,
pn= pn1
et
pn= 1
2pn1 pn1
.
Ainsi, au fil des générations, les proportions de mâles et de femelle s'équilibrent, jusqu'à obtenir les mêmes fréquences
gamétiques.
1 / 11 100%