GENETIQUE DES POPULATIONS Support de travaux-dirigés 2016-2017 UFR de Génétique Évolutive et Amélioration des Plantes Karine Alix-Jenczewski, [email protected] Philippe Brabant, [email protected] Julie Fiévet, [email protected] Pierre Gérard, [email protected] Jean-Pierre Henry, [email protected] AVERTISSEMENT Le présent document sert de support aux travaux dirigés. Il présente des exercices qui seront développés au cours des séances de TD, et il résume dans des encadrés introductifs ou de bilan de chaque séance, les notions essentielles à retenir en génétique des populations. Il ne dispense pas de la lecture du cours polycopié intitulé "Génétique des Populations". Vous serez supposés avoir lu et compris ce polycopié de cours en vue de l'examen, à l'exception de certains passages traitant de notions non vues en TD, et qui vous seront précisés en temps utile. Aussi, il vous est vivement recommandé de faire cette lecture au fur et à mesure de l'avancement des TD. Les chapitres et pages du polycopié correspondant aux notions traités aux diverses séances sont précisées dans ce document-ci, à la fin du texte correspondant à chaque séance. La génétique des populations s'intéresse à la composition génétique des populations et à ses variations dans l’espace et dans le temps. Elle fournit un cadre formel permettant de décrire cette composition, de comprendre les mécanismes qui déterminent l'évolution des populations, pour reconstruire leur histoire ou prédire leur évolution future. Ses applications concernent les divers domaines de, l’évolution, la sytématique, la gestion des populations naturelles ou domestiques (sélection, conservation, lutte...), la gestion de la biodiversité, et de domaines qui ont trait à la diversité génétique humaine (médecine, épidémiologie, pharmacogénétique, médecine légale...) Quelques définitions : Gène : unité d'information biologique, transmise au cours des générations, codant pour une fonction. Correspond à une séquence d'une macromolécule (ADN ou ARN) transmise telle quelle (à de rares modifications près), transcrite et généralement traduite par un système biochimique idoine, ce qui permet l'expression d'une activité biologique. Locus : historiquement, position du gène sur le chromosome. En génétique des populations, ensemble de gènes homologues (classe d'homologie). Deux chromosomes ou deux gènes sont homologues s’ils s’apparient et s’excluent mutuellement à la méiose : on ne trouvera donc pas deux gènes homologues présents en même temps dans une cellule haploïde. Gènes allèles : deux gènes homologues sont dits allèles quand ils ont des formes différentes. Un allèle est donc une classe de gènes homologues qu’on ne distingue pas entre eux au niveau phénotypique. Le phénotype est ce qu’on observe, il dépend donc du niveau d’observation. Dès lors, le nombre d’allèles identifiés à un locus dépend lui aussi du niveau d’observation. Par exemple, pour une enzyme on peut trouver deux allèles lorsqu’on s’intéresse à sa fonctionnalité (fonctionnelle vs non fonctionnelle), mais au sein de chacun de ces deux allèles il est possible d’observer différentes séquences protéiques et en remontant jusqu’aux gènes différentes séquences nucléotidiques. Pour une même protéine, le nombre d'allèles trouvés au niveau des séquences est en général beaucoup plus élevé que le nombre observé au niveau macroscopique. Gènes identiques par descendance : gènes issus de la transmission d'un même gène ancestral, sans qu'aucune mutation ne se soit produite dans la chaîne de parenté. Haplotype : séquence (pouvant couvrir plusieurs gènes et séquences non codantes, et même tout un chromosome) qu'on reconnaît comme différente d'une autre séquence homologue. Plus particulièrement utilisé pour désigner le génotype haploïde pour un ensemble de gènes ou séquences étroitement liés sur un chromosome (donc tendant à être hérités en bloc) et différent d'un autre en plusieurs sites. Le terme s'est imposé avec le développement des méthodes moléculaires permettant de caractériser les séquences d'ADN. Génétique des populations - 1ère année AgroParisTech – 10/2016 1 Diversité génétique d’une population traditionnelle de maïs révélée par un marqueur RFLP : sonde BA1/enzyme HindIV Figure 1 : Trois séries d’électrophorèses réalisées à partir d’un échantillon d’individus d’une population traditionnelle de maïs et révélant un marqueur RFLP. Chaque puits contient l’ADN d’un individu. Les puits notés "Témoin" sont des témoins de migration. Deux allèles sont présents au locus considéré. On peut reconnaitre les homozygotes au fait qu’ils ne présentent qu’une bande haute ou basse et les hétérozygotes qui ont les deux bandes. Génétique des populations - 1ère année AgroParisTech – 10/2016 2 SEANCE N° 1 Structure génétique des populations et Loi de Hardy-Weinberg La brachydactylie envahira-t-elle l’espèce humaine ? A un locus, la composition génétique d'une population est entièrement définie par les fréquences génotypiques et les fréquences alléliques à ce locus. Les fréquences alléliques se déduisent facilement des fréquences génotypiques. Exemple : dans une population avec 50 individus dont 25 de génotype A1A1, 20 de génotype A1A2 et 5 de génotype A2A2, - les fréquences des génotypes A1A1, A1A2 et A2A2 sont respectivement 0,5, 0,4 et 0,1 ; - il y a au total 100 gènes, dont 70 gènes A1 et 30 gènes A2; donc les fréquences des allèles A1 et A2 (notées traditionnellement p et q) valent respectivement p = 0,7 et q = 0,3. Exercices : 1) Calculer les fréquences alléliques dans les populations suivantes : AA Aa aa (Effectif total) Population 1 : 28 24 48 (100) Population 2 : 16 48 36 (100) Population 3 : 40 0 60 (100) Population 4 : 0 80 20 (100) Qu'en concluez-vous ? 2) Une population est analysée à un locus particulier, où elle présente la composition suivante : Génotypes AA Aa aa H0 R0 Fréquences D0 (D0, H0 et R0 sont les fréquences des trois génotypes à la génération 0. Ce sont des valeurs quelconques, dont la somme fait 1; "D" pour "dominant", "H" pour "hétérozygote", "R" pour "récessif".) Comment évoluent dans cette population les fréquences alléliques d’une part, et les fréquences génotypiques d’autre part, si les gamètes A et a s'unissent au hasard (situation appelée "panmixie") ? Quelles sont les autres hypothèses implicites de ce modèle ? 3) Que pensez-vous de la suggestion de Yule (cf. p. suivante) concernant la brachydactylie (cf. illustration au verso) ? Génétique des populations - 1ère année AgroParisTech – 10/2016 3 Génétique des populations - 1ère année AgroParisTech – 10/2016 4 On retiendra : • Notions de fréquences alléliques et de fréquences génotypiques. Connaissant les fréquences génotypiques, on peut toujours calculer les fréquences alléliques. Mais à l'inverse, la connaissance des fréquences alléliques ne permet pas d'en déduire automatiquement les fréquences génotypiques : il faut, pour cela, faire des hypothèses sur la façon dont les gènes sont associés par paires dans les individus diploïdes, c'est-à-dire sur la façon dont les gamètes s'unissent pour former les zygotes. • Notion de régime de reproduction. C'est l’ensemble des phénomènes biologiques qui déterminent la façon dont les gamètes de divers génotypes s'unissent à la fécondation, et donc la relation entre les fréquences alléliques et les fréquences génotypiques. • Notion de: panmixie C’est l’union au hasard des gamètes ou des porteurs de gamètes quant à leur génotype au locus considéré. • Loi de Hardy-Weinberg (cf. polycopié) Elle comporte deux aspects indépendants : - Absence de pressions évolutives donc pas d'évolution des fréquences alléliques au cours des générations successives ; - Régime de reproduction panmictique impliquant une relation simple entre fréquences génotypiques et alléliques. Si p=f(A) et q=(1-p)=f(a) sont les fréquences de A et a dans les gamètes, les fréquences des génotypes AA, Aa et aa au sein de zygotes obtenus en panmixie seront p2, 2pq et q2 respectivement. Pages correspondantes du polycopié, à lire: p.1-7 Génétique des populations - 1ère année AgroParisTech – 10/2016 5 SEANCE N° 2 Influence du régime de reproduction sur la structure génétique des populations On appelle régime de reproduction l'ensemble des phénomènes biologiques qui influencent la façon dont les gamètes ayant divers génotypes s'unissent à la fécondation, et donc la relation entre les fréquences alléliques et les fréquences génotypiques. Les principaux régimes de reproduction sont les suivants : - Panmixie : union au hasard des gamètes, ou bien des porteurs de gamètes. - Autogamie : chaque individu se reproduit par autofécondation. - Régime consanguin : Les individus apparentés se reproduisent entre eux plus souvent qu’au hasard. L’autogamie est une forme extrême de régime consanguin. - Homogamie : Les individus qui se ressemblent pour un caractère phénotypique se reproduisent entre eux plus souvent qu’au hasard. - Hétérogamie : Les individus qui diffèrent pour un caractère phénotypique se reproduisent entre eux plus souvent qu’au hasard. Exercices : 1) Dans une population de plantes à fleurs, où les fréquences initiales des trois génotypes à un locus sont les suivantes : Génotypes AA Aa aa Fréquences D0 H0 R0 Calculer l’évolution des fréquences génotypiques et des fréquences alléliques au cours des générations, en l’absence de pressions évolutives, si le régime de reproduction est : - l’autogamie - un régime mixte : pour chaque individu, une proportion (1– t) de ses graines est produite par autofécondation, et le reste des graines (en proportion t), est produit en panmixie. (Exprimer Hn, fréquence des hétérozygotes à la génération n en fonction de Hn-1, et chercher la fréquence d’équilibre He.) 2) Dans une population humaine, existent deux phénotypes [A] et [a], déterminés par un locus à deux allèles, A et a, avec A dominant sur a. La structure génétique est quelconque (proportions D0, H0 et R0 des trois génotypes). Un dictateur fou décrète que les seules unions autorisées, dorénavant, sont les unions [A]×[a]. - Comment va évoluer la structure génétique de la population, en supposant que le décret est parfaitement appliqué ? (considérer la situation après deux générations) - Que pouvez-vous dire des fréquences alléliques ? Et de la proportion d'hétérozygotes (comparer à 2pq) ? - Connaissez-vous des systèmes génétiques qui fonctionnent comme ce système politique ? Génétique des populations - 1ère année AgroParisTech – 10/2016 6 Régimes de reproduction On retiendra : • Régime de reproduction panmictique (p2, 2pq, q2), régime ouvert (fréquence des hétérozygotes H > 2pq), régime fermé (H < 2pq). • Différents types de régimes de reproduction fermés : autogamie (crée un déficit en hétérozygotes sur l'ensemble des locus, mène à l'homozygotie complète quand l'autogamie est à 100%), consanguinité (effet sur tout le génome), homogamie (crée un déficit en hétérozygotes au(x) locus concerné(s)),. • L’hétérogamie, régime de reproduction ouvert, implique une forme de sélection qui avantage les allèles rares au(x) locus contrôlant l'hétérogamie. • S'il n'y a pas de sélection associée, le changement de régime de reproduction modifie la structure génotypique mais ne modifie pas les fréquences alléliques. • Suivant les locus ou les caractères étudiés, on pourra conclure dans une même population à des conclusions différentes quant au régime de reproduction auquel chacun des caractères étudiés est soumis. Par exemple dans de nombreuses populations humaines on ne peut pas rejeter l’hypothèse de panmixie pour les groupes sanguins (A, B, O ou M,N), la taille est souvent soumise à un régime à tendance homogame alors qu’il y a hétérogamie obligatoire pour le sexe. Pages correspondantes du polycopié, à lire: p.8-10 (hormis l'encadré 3); 11-13. Génétique des populations - 1ère année AgroParisTech – 10/2016 7 Les pressions évolutives définitions : Une pression évolutive est, par définition, un processus qui entraîne des variations de fréquences alléliques. Il existe quatre pressions évolutives : la sélection, la migration, la mutation, et la dérive génétique. • On dit qu'il y a sélection si, dans des conditions de milieu données, certains génotypes survivent et se reproduisent mieux que d'autres. On peut quantifier la sélection par les valeurs sélectives des différents génotypes (traditionnellement notées w). La valeur sélective d'un génotype est le nombre espéré de descendants qu’il produit par génération. Cela intègre la probabilité de survie des individus du génotype considéré (leur viabilité) et leur fertilité. Comme seuls importent, pour l’évolution des fréquences alléliques, les rapports entre les valeurs sélectives des divers génotypes, on utilise souvent, en pratique, des valeurs sélectives relatives : rapport de la valeur sélective du génotype considéré à celle d’un génotype pris comme référence (qui a alors la valeur sélective relative de 1). • La migration, correspond à des échanges génétiques entre populations. L'immigration à partir de populations ayant une composition génétique différente entraîne un changement des fréquences alléliques dans la population receveuse. Le taux de migration (par génération) correspond à la probabilité qu'un gamète ou un individu dans une population donnée soit un immigrant. • La mutation est la transformation "accidentelle" d'un gène en un autre. Le taux de mutation (par génération) de l'allèle A1 en l'allèle A2 est la probabilité qu'un gène A1 se transforme en gène A2. • La dérive génétique se définit comme la variation aléatoire des fréquences alléliques d'une génération à l'autre dû à l'effectif fini de la population : de ce fait, chaque génération est un échantillon ne reflétant pas forcément exactement la composition espérée par la loi des grands nombres. Génétique des populations - 1ère année AgroParisTech – 10/2016 8 SEANCE N° 3 Sélection et dérive Parmi les pressions évolutives, nous allons explorer plus particulièrement les effets de la sélection et de la dérive génétique sur l'évolution des fréquences alléliques, grâce au programme Populus. 1. Evolution des fréquences alléliques dans une population diploïde sous l'effet de la sélection : Ouvrir Populus sous windows, puis dans l’onglet "Model" choisir "Natural Selection" puis "Selection on a Diallelic Autosomal Locus". La fenêtre de dialogue suivante apparaît : Ce module calcule, de façon déterministe, l'évolution des fréquences alléliques sous l'effet de la sélection (avec des valeurs sélectives que l'on choisit) dans une population panmictique diploïde de taille infinie. Génétique des populations - 1ère année AgroParisTech – 10/2016 9 Choisir les paramètres suivants : graphe "p vs t" (c.à.d. affichage de l'évolution de la fréquence allélique p en fonction du nombre t de générations de sélection) ; "Fitness" pour utiliser des valeurs sélectives relatives (cf. définition page ci-contre) : wAA, wAa, waa (valeurs à choisir selon le tableau ci-dessous, par exemple 1, 0.9 et 0.8) ; vous choisirez d'abord "One Initial Frequency" et, dans ce cas, il faut choisir une fréquence de départ pour A (0.01 par ex.); on pourra choisir ensuite d'autres valeurs ou bien utiliser "Six Initial Frequencies" (le programme choisit alors pour vous six fréquences initiales et affiche les six courbes à la fois; les fréquences choisies sont 0.02, 0.2, 0.4, 0.6, 0.8, et 0.98). Enfin sélectionner le nombre de générations pendant lequel la population va évoluer "Generations=200". Quand vous avez choisi ces options, lancez la simulation grâce au bouton "View" . Vous obtiendrez alors le graphe de l'évolution de la fréquence p de l'allèle A au fil des générations (t). Redimensionnez la fenêtre de sortie en fonction de votre écran, mais veillez à ne pas occulter la boîte de dialogue. Pour une meilleure visualisation des fréquences au cours du temps utiliser le bouton "Options" en haut à gauche de la fenêtre de sortie et choisir "FinerGrid". Après avoir fait varier les valeurs sélectives relatives et les fréquences initiales, comme proposé dans le tableau ci-contre, répondre aux questions suivantes : - Quel est l'effet de l'ampleur des différences entre valeurs sélectives relatives ? (comparer les cas 1 et 2) - Quel est le devenir de l'allèle favorable (comparer les cas 1 et 3) ? - Quels sont les états d'équilibres possibles ? (ensemble des cas 1 à 5, en utilisant "sixfrequency") - Quelle est l’influence de la dominance ou de la récessivité pour la valeur sélective ? (cas 6,7 et 8) Comment peut-on expliquer cela ? Génétique des populations - 1ère année AgroParisTech – 10/2016 10 ex. de choix de val. sélectives cas wAA Allèle A favorable (1) Allèle A favorable (2) Allèle a favorable (3) bis bis (1 , 3 ) 1 0.9 0.8 1 0.7 0.4 0.8 0.9 1 Refaire (1) et (3) avec 0.9 1 0.8 1 0.8 0.9 1 1 0.9 wAa choix conseillés pour une bonne visualisation waa fréq. initales One frequency (0.01) Idem One frequency (0.99) Six frequencies Six frequencies Six frequencies One frequency (0.01) (4) (5) (6) Superdominance Sous-dominance A favorable dominant (7) A favorable récessif 1 0.9 0.9 One frequency (0.01) (8) a favorable dominant 0.9 1 1 One frequency (0.99) Fermer la fenêtre de dialogue (bouton t 200 200 200 200 200 200 200 200 puis 1000 200 ) avant de passer à la deuxième partie du TD. 2. Evolution des fréquences alléliques dans une population de taille finie Dans l’onglet "Model" choisir "Mendelian Genetics" puis "Genetic Drift". Le programme simule ici une population panmictique diploïde de taille N finie, constante. Chaque génération successive est constituée par tirage au hasard de 2N gamètes produits par la génération précédente, qui sont ensuite unis au hasard (panmixie) pour former les N individus de cette nouvelle génération. Si la fréquence de l'allèle A dans la génération parentale est p, chacun des 2N gamètes tirés au hasard pour former la génération suivante a une probabilité p d'être A et q=(1-p) d'être a. (C'est comme si on tirait au hasard 2N boules dans une urne infinie contenant des boules noires et blanches en proportions p et q...). a) Dans la fenêtre de dialogue choisir l’option "Monte-Carlo" ; dans la fenêtre "Runtime" cliquer sur Other et fixer à 50" le nombre de générations à simuler ; choisir ensuite "Population Size (N) = 20" ; "Number of Loci = 6" (à voir ici comme 6 populations différentes) ; "Initial Frequency = 0.5". Les fréquences de départ de l’allèle A seront fixées collectivement à p0=0.5 (les 6 populations ont la même fréquence initiale de A). Lancer la simulation avec le bouton et faire plusieurs répétitions grâce au bouton de la fenêtre de sortie. Décrire l'évolution des fréquences alléliques au cours du temps. Voyez-vous pourquoi elles évoluent ? b) Refaire des simulations en changeant la taille de la population, N=50, puis N=200. Que se passe-t-il lorsque la taille de la population augmente ? c) Choisir les paramètres suivants : taille de la population N=20; nombre de générations à simuler (Runtime) t=150. Faire varier la fréquence de départ de l'allèle A (p0=0.1, p0=0.5, p0=0.9), et regarder le nombre de fois où l'allèle A se fixe, et le nombre de fois où c'est l'allèle a qui se fixe. Faire plusieurs répétitions (au moins deux) pour chaque jeu de paramètres. Que constatez-vous ? Génétique des populations - 1ère année AgroParisTech – 10/2016 11 Tiré de « Principles of Population Genetics », D.L. Hartl et A.G. Clark, 1989, Sinauer Ass. Génétique des populations - 1ère année AgroParisTech – 10/2016 12 3. La dérive génétique, modèle à nombre infini de populations Revenir à la fenêtre de dialogue et choisir cette fois l’onglet "Markov". Ce module calcule, de façon déterministe, la distribution de la fréquence d’un allèle dans une infinité de populations diploïdes de taille finie, se trouvant toutes dans le même état initial et dérivant toutes en même temps. L'affichage donne, génération après génération, la proportion des populations ayant chaque fréquence allélique possible (avec 10 individus, donc 20 gènes, il existe 21 fréquences alléliques possibles pour A: p=0.00, 0.05, 0.10, 0.15, ... jusque 1.00). Fixer le nombre de gènes A par population à 10 et le nombre d'individus par population (Population Size) à 10. Ce qui fixe la fréquence initiale p0= 0.5, car 10 individus = 20 gènes. a) Cliquer sur , puis cliquer une fois sur . Quelle est l'allure de la distribution de probabilité après une génération, après quelques générations, après un grand nombre de générations (cliquer à répétition sur pour faire défiler les générations) ? b) Refaire la simulation pour 2 gènes A (ce qui correspond à p0=0.1). c) Comment évoluent dans les deux cas la fréquence allélique moyenne et la variance des fréquences alléliques ? Fermer la fenêtre de dialogue (bouton ) avant de passer à la 4ème partie du TD. 4. Dérive génétique et sélection Sous l’onglet "Model" choisir "Mendelian Genetics" puis "Drift and Selection". Ce module simule une population de taille finie, soumise à la sélection naturelle. a) Choisir les paramètres suivants : taille de la population (N) = 100 individus; fréquence initiale de l'allèle A : p0=0.1; valeurs sélectives relatives wAA=1, wAa=0.95, waa=0.9; nombre de générations à afficher = 500. (Rem.: en fait, ici, le programme affiche juste le nombre de générations nécessaire jusqu'à la fixation. L'échelle des abscisses change donc à chaque simulation.) Lancer plusieurs simulations avec le même jeu de paramètres (utiliser la touche dans la fenêtre de dialogue), changer la taille de la population (N)=20 individus et lancer plusieurs simulations. Que peut-on conclure concernant les effets conjoints de la dérive génétique et de la sélection ? b) En prenant N = 500 individus (1000 gènes), prendre p0=0.001 pour simuler l'apparition d'un gène favorable par mutation (1 gène muté apparu parmi les 1000 gènes de la population). Considérez que la mutation est favorable (valeurs sélectives 1, 0.95, 0.9). Faites une série de simulations. Qu'en concluez-vous ? Quittez le programme Populus avec le bouton Quit: Génétique des populations - 1ère année AgroParisTech – 10/2016 13 Figure 5 : Evolution de la fréquence du gène de coloration (black+ = allèle sauvage) chez le ver de farine (Tribolium castaneum) dans deux séries de 12 populations, avec des effectifs par génération de N=10 et N=100, respectivement (d’après Rich et al, 1979). Les hétérozygotes sont reconnaissables. Génétique des populations - 1ère année AgroParisTech – 10/2016 14 On retiendra : • La sélection entraîne des variations systématiques des fréquences alléliques. Agissant seule, elle aboutit in fine à l'élimination de l'allèle défavorable et la fixation de l'allèle le favorable (on dit qu'un allèle est "fixé" quand il atteint une fréquence de 1), à une vitesse qui dépend de l'ampleur des différences entre valeurs sélectives des divers génotypes, et aussi beaucoup des relations de dominance/récessivité (c.à.d. où se situe la valeur sélective des hétérozygotes par rapport à celle des homozygotes). Si la valeur sélective des hétérozygotes est supérieure à celle des deux homozygotes, les deux allèles se maintiennent indéfiniment à une fréquence d'équilibre non nulle. • La dérive génétique est un processus aléatoire à l’œuvre dans les populations de taille finie. Il consiste en l’échantillonnage au hasard des gamètes ou des porteurs de gamètes lors du passage d’une génération à la suivante. En l’absence d’autres pressions évolutives, en population finie, les fréquences des allèles fluctuent aléatoirement d’une génération à l’autre. Le seul état d’équilibre en l’absence de mutation est la fixation d’un allèle. • Dérive génétique et sélection : Dans une population de petite taille, même un allèle défavorable peut se fixer par hasard, et cela d’autant plus facilement que le désavantage sélectif qu’il induit est petit. • Dans une population finie, une mutation nouvellement apparue, même avantageuse, a une forte probabilité d'être perdue. Pages correspondantes du polycopié: p.16-19 (pour la dérive); 21-24 (pour la sélection) Génétique des populations - 1ère année AgroParisTech – 10/2016 15 SEANCE N° 4 : Mutations contre sélection : Le cryptopolymorphisme Qui est porteur de gènes létaux ? Il se produit sans cesse des mutations. Certaines mutations sont sélectivement neutres, c'est-àdire n'ont aucune influence perceptible sur le bon fonctionnement du gène et donc sur la viabilité et la fertilité des individus qui la portent. Souvent, cependant, les mutations produisent des gènes défectueux. La sélection tend à les éliminer, mais il y a sans cesse des mutations qui réintroduisent ces allèles dans la population. Cette situation permet de comprendre la fréquence des maladies génétiques. Excercice I : On considère, dans l'espèce humaine, un locus où l'allèle A peut muter à chaque génération en une forme a, avec une probabilité u (le "taux de mutation" de A en a; typiquement de l'ordre de u = 10-5 ou 10-6). Autrement dit, parmi les gamètes produits par la population, une proportion u des gamètes qui auraient été normalement A sont transformés, "mutés", en gamètes a. On suppose que cette mutation n'a aucune influence sur la viabilité ou la fertilité des individus qui la portent, que ce soit à l'état homozygote ou hétérozygote (pas de sélection). On suppose aussi qu'il n'y a pas de migration et que la population est infinie (pourquoi ?) 1. Si on part d'une fréquence p0 de A et q0 = 1 – p0 de a, quelles seront les fréquences p1 et q1 de A et de a à la génération suivante, en fonction des fréquences initiales et de u ? 2. Quelle sera la fréquence pn de A au bout de n générations ? 3. Avec u = 10-5, combien faudra-t-il de générations pour que la fréquence initiale du gène A soit diminuée de moitié ? En prenant une durée de génération de 25 ans, combien de temps cela représente-t-il ? Qu'en concluez-vous ? Excercice II : La maladie de Tay-Sachs est une maladie génétique due à une déficience d’une enzyme lysosomale (l’hexosaminase A) qui normalement catalyse l’hydrolyse d’un glycolipide abondant dans les membranes des neurones (le ganglioside GM2). Le nouveau-né atteint de cette maladie est normal, mais vers l’âge de 6 mois, apparaissent les premiers signes d’une dégénérescence progressive du tissu nerveux : paralysie croissante, cécité progressive, retards psychiques... Les enfants atteints meurent vers l’âge de 4 à 5 ans. Il y a autant de garçons que de filles atteints par cette maladie. En Europe, il naît environ un enfant atteint pour 250 000 naissances. 1) Evaluer la fréquence de l'allèle responsable de la maladie, en supposant qu’il est dominant sur l’allèle normal, puis en supposant qu’il est récessif. Préciser et discuter les hypothèses nécessaires aux calculs. Génétique des populations - 1ère année AgroParisTech – 10/2016 16 2) Dans les deux hypothèses (dominance ou récessivité), évaluer le taux de mutation qui amène à la fréquence observée de la maladie. 3) Une étude suédoise a montré que parmi les enfants atteints, environ 15 % étaient issus d’unions entre cousins germains, alors que la fréquence de ces unions n’était que de 5 pour 1000 dans la population étudiée. Cela permet-il de trancher sur la dominance ou la récessivité du gène ? III. Quelle est la réponse à la question du titre ? On retiendra : • Les mutations font apparaître de nouveaux allèles dans une population. Cependant, en l’absence de toute autre pression évolutive, un allèle produit par des mutations survenant de façon récurrente met un temps très long à envahir la population. • Si la mutation est sélectivement neutre, dans une population non-infinie, c'est la dérive génétique qui déterminera le devenir d'une nouvelle mutation. Comme celle-ci est en fréquence très faible lorsqu'elle apparaît (1 gène sur 2N), elle est très souvent perdue, mais le cas inverse où elle envahit la population peut survenir (avec une probabilité égale à la fréquence initiale 1/2N : cf. TD 3). Dans une population finie, la perte d'un nouvel allèle apparu par mutation peut survenir aussi dans les premières générations suivant son apparition, même si le nouvel allèle est favorisé par la sélection. • La sélection peut permettre une croissance rapide, comparativement, de la fréquence d’un allèle favorable, c’est à dire conférant un avantage sélectif aux individus qui l'expriment, même si cet avantage sélectif semble faible. En résumé, « la mutation propose, la sélection dispose ». • Toutefois, lorsque l'allèle défavorable est récessif, et l'allèle favorable dominant, la fixation complète de l'allèle favorable par sélection ne se fait que très lentement (cf. TD 3 sur Populus) : lorsqu'il est rare, l'allèle défavorable récessif est difficilement éliminé dans une population panmictique, car il est essentiellement chez des hétérozygotes (2pq >> q2 quand q est faible), où il est "masqué". • Par conséquent, du fait de mutations récurrentes produisant des allèles défectueux récessifs, il s'établit un équilibre "mutation contre sélection" aboutissant à une fréquence de l'allèle délétère qui n'est pas tout à fait négligeable. • Plus précisément, pour un locus biallélique dans une population panmictique, si les valeurs sélectives relatives des trois génotypes AA, Aa et aa valent 1, 1, et 1-s respectivement, avec 0 < s ≤ 1 (s est le désavantage sélectif des individus aa), et si l’allèle a apparaît par mutation avec la probabilité u à chaque génération, la fréquence d'équilibre de l’allèle délétère récessif vaut q= us . La fréquence attendue des individus atteints est u q2 = s. Pages correspondantes du polycopié: p.24-25 (mutation); 36-42 (cryptopolymorphisme) Génétique des populations - 1ère année AgroParisTech – 10/2016 17 L'anémie falciforme à travers quelques extraits d'articles (1) Extrait de La Recherche, Juillet-Aout 1981, n° 124, article de Gilles Sauclières. "L’anémie falciforme est une maladie héréditaire grave, souvent mortelle, toujours handicapante, que l’on observe surtout parmi les populations noires africaines et américaines. [...] Ce qui domine dans cette maladie, ce sont des crises douloureuses, liées à l’arrêt de la circulation du sang dans certains organes, responsables indirects d’une mort qui survient, en général à l’adolescence. [...] Les globules rouges des malades [...] contiennent une hémoglobine légèrement différente de la normale (appelée HbS), dont les deux chaînes α sont normales, mais dont les chaines β (βS) diffèrent de la chaîne β normale (βA) par le remplacement d’un acide aminé, l’acide glutamique (en position 6 dans la séquence normale), par la valine." (2) Extrait de Pour la Science, Octobre 1981, article de M. Friedman et W. Trager "Les symptômes de la maladie se manifestent lorsque les globules rouges SS abandonnent leur oxygène au niveau des tissus. Quand l’hémoglobine S est réduite, elle s’agrège en fibres longues et minces ; les globules se déforment et [...] adoptent fréquemment une forme caractéristique en faucille [...]. Lors d’une crise, les cellules falciformes bloquent la circulation sanguine locale ; cela entraîne une baisse supplémentaire de la quantité d’oxygène disponible, un accroissement du nombre de cellules déformées et l’apparition d’importantes zones nécrosées. En l’absence d’un traitement médical très sévère, les chances de survie des sujets SS sont extrêmement faibles. Les individus hétérozygotes ne sont généralement pas atteints : leurs globules rouges AS renferment suffisamment d’hémoglobine normale, ainsi la déformation n’intervient-elle que dans des conditions extrêmes, par exemple à haute altitude." "C’est en observant la répartition géographique du paludisme et de l’anémie à hématies falciformes que nous avons été conduits à penser que la mutation associée à cette maladie génétique pouvait conférer une certaine résistance au paludisme. Les preuves cliniques furent plus difficiles à rassembler mais, en 1954, Anthony Allison [...] constata que des enfants hétérozygotes pour le gène [...] étaient moins gravement touchés par le paludisme. L’une des indications les plus nettes de l’effet protecteur que joue le gène de l’anémie à hématies falciformes est que très peu de porteurs meurent de complication cérébrales lorsqu’ils sont atteints de paludisme à Plasmodium falciparum." (3) Extrait d’un article du Monde du 20 Août 1975, par le professeur Jean Rosa "L’incidence de la tare* est exceptionnellement élevée. Le nombre de porteurs dépasse 12% de la population noire aux Etats-Unis [...]. En Afrique [en zones équatoriales, tropicales humides et en bordures maritimes], l’incidence oscille entre 18 et 40% suivant les territoires. [...] Il s'agit sans conteste de la tare morbide la plus fréquente de par le monde." [* Rem.: le terme de "tare" était naguère celui couramment utilisé en médecine pour désigner une maladie génétique. Du fait de la connotation péjorative qu'il a dans le langage courant, ce terme n'est plus guère utilisé de nos jours.] "La situation en Martinique, en Guadeloupe et à la Réunion est particulièrement préoccupante. La population de ces territoires est d’origine noire dans sa très grande majorité. L’insularité favorise tout naturellement la progression des tares par le phénomène bien évident de l’endogamie (unions se produisant dans des populations de taille limitée avec relativement peu d’apport ethnique venant de l’extérieur). [...] Aucun conseil génétique n’a été établi. Seules des enquêtes fragmentaires ont eu lieu, qui ont montré que l’incidence de la tare [fréquence des porteurs] devait être comprise entre 8 et 12%." Génétique des populations - 1ère année AgroParisTech – 10/2016 18 SEANCE N° 5 : Le polymorphisme Pourquoi sommes-nous tous différents ? La sélection tend à fixer l'allèle le plus favorable et à éliminer les allèles défavorables. Ces derniers ne peuvent se maintenir que parce que des mutations les réintroduisent, mais ils restent toujours en fréquence très faible. C'est la situation que nous avons vu précédemment ("cryptopolymorphisme", TD4). D'un autre côté, si la sélection n'intervient pas (allèles sélectivement neutres), nous avons vu que la dérive devait, elle aussi, aboutir à fixer un allèle et à ce que les autres soient perdus (TD3). Or tout cela ne correspond pas à la structure de la variabilité génétique qu'on observe dans les populations de presque toutes les espèces: au contraire, pour la plupart des gènes, coexistent dans les populations plusieurs allèles en fréquence du même ordre de grandeur, situation que l'on nomme polymorphisme génétique : par exemple, chez l'homme, les groupes sanguins, la couleur des yeux et toute la variation phénotypique "courante", ainsi que le polymorphisme pour de nombreux marqueurs moléculaires. Comment expliquer ce paradoxe ? Plusieurs explications ont été avancées. L'une des premières qui fut proposée est que la sélection agit de façon telle qu'elle favorise le maintien de plusieurs allèles. Un cas célèbre et bien connu est celui de l'anémie falciforme rappelé cicontre. Exercice : 1) Dans l'extrait d'article (3), il est indiqué qu'en Afrique noire, la fréquence des porteurs "oscille entre 18 et 40% suivant les territoires". Calculer la fréquence de l'allèle S dans une population africaine d'adultes avec 30% de porteurs (on admettra que tous les enfants atteints meurent avant d'atteindre l'âge adulte, ce qui était le cas jusqu'à une période récente). 2) Expliquez la fréquence élevée du gène S en Afrique. Estimez les valeurs sélectives relatives des trois génotypes en Afrique (toujours en supposant une fréquence de 30% de porteurs). Précisez les hypothèses faites. 3) Pour la population noire des Etats-Unis (12% de porteurs selon (3)), calculez la fréquence de l'allèle S. Comment expliquez-vous cette fréquence ? 4) Que pensez-vous de l'affirmation de l'article (3) selon laquelle "L’insularité favorise tout naturellement la progression des tares par le phénomène bien évident de l’endogamie (unions se produisant dans des populations de taille limitée avec relativement peu d’apport ethnique venant de l’extérieur)." ? La supériorité des hétérozygotes ("superdominance") a été un temps considérée comme pouvant expliquer la plupart des polymorphismes observés. Mais... Génétique des populations - 1ère année AgroParisTech – 10/2016 19 On retiendra : • Si les valeurs sélectives génotypiques sont constantes, le seul cas où un polymorphisme sélectionné peut s’établir et se maintenir correspond à la superdominance (les hétérozygotes ont une valeur sélective supérieure à celle des homozygotes). • Mais il est peu probable que la superdominance soit impliquée dans beaucoup de cas de polymorphismes... D'autres types de sélection : • La variabilité des valeurs sélectives dans l’espace et dans le temps permet le maintien d’une diversité sélectionnée, sans qu’il y ait nécessité de superdominance, et cela pourrait être une explication plus générale aux nombreux polymorphismes observés. • La sélection fréquence-dépendante ("avantage du rare") peut jouer aussi un rôle. Dérive génétique et mutations neutres : • Le jeu combiné des deux peut suffire à expliquer l'existence du polymorphisme, sans faire appel à aucune espèce de sélection. Cette explication "neutraliste" du polymorphisme est notamment invoquée pour une grande part du polymorphisme observé au niveau de l'ADN ou des protéines. • Le nombre de différences entre deux séquences homologues d’ADN trouvées chez deux espèces différentes dépend du temps de divergence entre les espèces et du taux de mutation neutre (non soumises à la sélection). On constate empiriquement qu’en général, pour un gène donné, ces mutations s’accumulent à un rythme à peu près constant chez toutes les espèces. C’est l’horloge moléculaire qui, une fois calibrée, permet de déterminer le temps qui sépare deux espèces de leur dernier ancêtre commun. • Les séquences d'ADN ou de protéines enregistrent donc l'apparentement entre les espèces. Cela fournit un outil puissant pour reconstituer les phylogénies. Pages correspondantes du polycopié: p.22-23 (sélection: révision); 46-57 Génétique des populations - 1ère année AgroParisTech – 10/2016 20