Annexe O. Génétique des populations. Page 1. Révision du 21/10/2016 Annexe O. Quelques compléments sur la génétique des populations. NB. 1. A côté de questions, que j’espère avoir éclairées, j’en ai rencontré beaucoup d’autres, auxquelles je n’ai pas de réponse. Elles sont posées, en notes en caractères « arial », à mesure de leur apparition dans ce « text in progress ». Là où – sans être sûr de la réponse – je penche d’un côté, je l’indique par un (oui ?) ou un (non ?). Les questions proprement dites sont mises en italiques. Leur numérotation peut comporter des trous : ils correspondent à des questions antérieures, qui ont trouvé leur solution. Je serai reconnaissant à mes lecteurs de me donner (par courriel – [email protected]) leur point de vue, ou de m’indiquer quelles lectures ils pourraient me recommander. 2. Les références de type sp-14-4B concernent la section 4B du chapitre 14 de « Science et philosophie ». Comme dans l’ensemble de cet ouvrage, les définitions sont en caractères gras, mes positions personnelles en caractères Arial. Les * après les noms des auteurs renvoient aux références à la fin de l’annexe. 1. Rappels généraux concernant les mutations. Toute mutation concerne le génome d’une cellule et se décrit au niveau élémentaire des nucléotides. Elle est due à des phénomènes externes (rayonnements, attaques chimiques, etc..), ou internes (erreurs de réplication, réarrangements de gènes…). Généralement, on a affaire à un pseudo-hasard déterministe, mais cela n’empêche pas, raisonnant en probabilité, de définir des taux de mutation. Plusieurs modes de mutation existent : substitution d’une base à une autre, délétion... Les taux de mutation différent (de 1 à 10) d’un mode à l’autre, mais on considérera un taux moyen μ. Ils sont généralement évalués au niveau des paires de base (pb) et exprimés, sous une forme utilisable par la génétique des populations, en nombres/pb/génération. Les conséquences d’une mutation sont très différentes, selon que l’on considère une cellule somatique ou une cellule germinale. Une mutation d’une cellule somatique peut, par exemple, déclencher le cancer fatal d’un individu. La mutation d’une cellule germinale sera transmise à toutes les cellules de tous les individus de sa lignée et influencera l’évolution. Les premières estimations des taux de mutation se sont longtemps Annexe O. Génétique des populations. Page 2. Révision du 21/10/2016 fondées sur les méthodes classiques de la génétique des populations, avec leurs inévitables circularités (choix d’un coefficient de sélection, d’une population « effective » bien loin de la population réelle, approximation de l’horloge moléculaire1, difficultés de la coalescence…). Une mutation peut : 1. concerner un seul nucléotide ; 2. déclencher un réarrangement d’un gène entier, qui affectera de nombreux nucléotides. 3. concerner un gène, appartenant à un réseau de gènes régulateurs et, par là, avoir des effets plus importants. Les probabilités des deux derniers cas sont extrêmement inférieures à celles du premier. Les seules probabilités, pour lesquelles des estimations sont possibles concernent le premier cas (au-delà, il sera difficile de traduire par un nombre l’adjectif « extrêmement »). Rappelons que nos conclusions viseront l’extrême improbabilité de l’évolution et donc qu’il suffira d’avoir fixé des limites supérieures, très faibles, à nos évaluations de probabilités. Un autre classement, corrélé au premier, se fonde sur l’effet de la mutation : elle peut être neutre (le plus souvent), létale (trop fréquente, elle menacerait le maintien de l’espèce), favorable (d’autant plus rare qu’elle est plus importante). Nous ne considérerons pas ici l’évolution à l’intérieur d’une espèce, pour laquelle un équilibre dynamique existe entre les différents allèles, et dont la description recueille un consensus. Pour les mammifères, la méthode principale étudie l’évolution de la divergence de leurs pseudogènes (gènes inactifs, non fonctionnels) ou 1 Quand on compare entre des espèces, dont les individus jouissent de durées de vie très différentes, on constate que le taux de mutation varie moins si on l’évalue par unité de temps que si on le fait par génération; ceci confirme l’hypothèse que les phénomènes extérieurs sont prépondérants, et justifie que l’on parte – quitte à l’infléchir à partir des données de l’expérience – de l’hypothèse d’une horloge moléculaire constante (qui bât au rythme du temps, et non à celui du nombre de générations). Annexe O. Génétique des populations. Page 3. Révision du 21/10/2016 de gènes synonymes, qui ont les uns et les autres l’avantage de ne pas intervenir dans la sélection naturelle. Les premières évaluations (Nachman*) ont concerné la divergence homme/chimpanzé. Elle remonte à 5.106 années, soit 2,5.105 générations de 20 ans. Rappelons parallèlement que la taille du génome humain est de 3.109 pb (paires de bases. Avec une estimation assez imprécise d’une population effective de 104, Nachman arrive à : μ = 2,5.10-8/pb/génération (soit 175/génome diploïde/génération). Toujours sur les mêmes principes, des estimations (KumarSubramanian*) ont été faites sur l’ensemble des mammifères ; elles concluent à un nombre un peu inférieur : μ = 2.10-9. Il est plus significatif, puisque portant sur une période plus longue. Il est probablement de portée plus générale, puisque la divergence homme/ chimpanzé a été exceptionnellement rapide. Remarque méthodologique : Quand on considère des gènes synonymes ou des pseudogènes, il est normal de donner le résultat par base. Mais quand nous nous préoccuperons de mutations importantes, nous donnerons des taux par codon, seul élément significatif. Il conviendra de les comparer au taux de mutations neutres par base, car – pour les mutations importantes – la seule modification d’une des trois lettres est une modification du codon. Chez les bactéries, et avec les immenses progrès faits dans le décryptage de leurs génomes, des méthodes plus directes sont possibles : ainsi sur Escherichia Coli, des « expériences d’évolution » (Wielgoss2011*) sur 40000 générations et des mutations synonymes concluent à environ 10-10/pb/génération. Les idées, assez naturelles, de Kimura sur la grande proportion de mutations neutres paraissent confirmées. Kimura* a développé des modèles mathématiques intéressants, permettant de calculer la probabilité P de fixation d’une mutation et le temps T de fixation (calculé en nombre de générations) en fonction du coefficient de Annexe O. Génétique des populations. Page 4. Révision du 21/10/2016 sélection s et de N (ainsi, dans l’hypothèse de la semi-dominance, il obtient : P = (1- e-2s)/ (1 – e-4Ns) et T = 2/s. log2N. Comme on a quelques données concrètes sur T (souvent au moins 103 générations), le calcul n’est pas complètement circulaire.2 2. Quelques difficultés de la génétique des populations. L’épistasie se définit comme le cas, très fréquent, où l’action de plusieurs gènes n’est pas purement additive. On conçoit que, très vite, les calculs y deviennent inextricables. Les modèles de « shifting balance » (une évolution plus rapide quand la population se divise en sous-populations isolées – Wright, S. 1977, Evolution and the Genetics of Populations. Chicago) ont été contestés. De même ses « paysages rugueux » (cf. annexe T) sont trop flous pour être utiles. Hétérozygotie. Il y a encore controverse aujourd'hui pour savoir si la "théorie de la balance évolutive" est vérifiée. Celle-ci, très schématiquement, tente de trouver une réponse au paradoxe suivant : Une population ne devrait présenter un fort taux d'hétérozygotie que si la possession simultanée de deux allèles différents présentait un avantage sélectif, la surdominance. Or, d'un côté on observe souvent des taux élevés d'hétérozygotie; de l'autre, on bâtit des raisonnements, d'après lesquels la surdominance ne devrait pas être fréquente. Il est plausible que, pour les mutations vraiment utiles, deux gènes, produisant "deux fois plus" de la bonne protéine, valent mieux qu'un; 2 Sur la rapidité de la divergence homme-chimpanzé, voir les développements de sp-14-4. Sur les mutations neutres, voir la fin de sp-14-3. Remarquons aussi, sur la probabilité p des fixations, que le cas le plus fréquent est celui où s est assez faible, mais sN assez grand ; il se simplifie en p = 2s (la mutation neutre serait celle où sN ≤ 1). Annexe O. Génétique des populations. Page 5. Révision du 21/10/2016 le cas souvent cité des deux allèles, l'un qui évite l'anémie, et l'autre qui protège de la malaria, est assez particulier La théorie de la balance essaie donc d'expliquer ces paradoxes. Mais elle recourt trop facilement à des hypothèse ad hoc, sur la fréquence des mutations, la variabilité des coefficients de sélection, ou de l'environnement extérieur. La meilleure explication est probablement, rejoignant la théorie neutraliste, de distinguer une forte hétérozygotie des caractères neutres, "sans importance", d'une homozygotie des caractères décisifs. - De même, dans la formule bien connue: H = 4Nνn/(4Nnν +1), reliant le taux d'hétérozygotie H au taux de mutation ν et à l'effectif de la population N, il est troublant que l'on trouve toujours des valeurs "acceptables" pour H (ni très proches de 0, ni très proches de 1), alors que N et ν, qui n'interviennent que par leur produit, sont totalement indépendants et connaissent chacun de grandes plages de variation. Le fardeau génétique voudrait traduire la diminution de la valeur sélective d’une population, quand – tout naturellement – elle ne contient pas que l’allèle le plus favorable. Cette notion, au mieux inutile, peut même avoir une dérive eugénique ! Polymorphisme et mutations neutres. Le polymorphisme se définit par la probabilité que deux individus différents aient, sur un site pris au hasard, une différence d’allèles. Il serait chez l’homme de 10-3. Il faut trouver un compromis entre meilleure adaptation absolue et souplesse vis à vis des bouleversements de l'environnement extérieur. O1. Le large polymorphisme observé est-il expliqué par une génétique des populations, qui prévoit au contraire la fixation du meilleur alléle? (intuitivement, un allèle reste neutre Annexe O. Génétique des populations. Page 6. Révision du 21/10/2016 pendant longtemps, puis prend son intérêt lors d’un changement notable de l’environnement). O2. Par ailleurs, dans l’évaluation des fréquences de mutations neutres, et du polymorphisme correspondant, ne conviendrait-il pas de distinguer les mutations banales, ne changeant pas la signification du codon en matière d’acide aminé, de celles où le codon est transformé, mais où cela n’a pas d’incidence visible sur l’individu ? - On cite toujours *l’anémie falciforme comme exemple d’un cas où l’hétérozygote est avantageux. Mais, n’est-ce pas un cas exceptionnel ? 03. .Anagenèse (évolution sans branchements) versus phylogénèse. Dans les discussions sur la macroévolution et les équilibres ponctués, comme dans celles sur la cladistique, cette distinction entre deux processus a une grande importance. A-t-on des moyens d’évaluer les parts respectives de ces deux processus dans l’évolution. Evidemment, par les mêmes arguments, qui fondent la notion de coalescence, la part de l’anagenèse est forcément faible. Mais peut-on la préciser ? L’Eve mitochondriale. Rappelons que les chromosomes des mitochondries se transmettent uniquement par les femmes. Un raisonnement de pure logique montre que – fatalement – il y a eu une époque et, à cette époque, une « Eve mitochondriale », seule à assurer jusqu’à aujourd’hui la descendance par les femmes. A chaque nouvelle génération, un certain nombre de femmes n’a pas de filles ; progressivement, les femmes des générations successives descendront d’un nombre décroissant des femmes d’origine (c’est un cas typique de coalescence). Mais on Annexe O. Génétique des populations. Page 7. Révision du 21/10/2016 conçoit que, si la population était importante à l’époque de cette Eve, la progression serait extrêmement lente ; à la limite, on ne remonterait pas à une femme, mais à un poisson femelle ! Dans la réalité, il est plus raisonnable de penser que les vraies candidates à la dignité d’Eve formaient au départ une population restreinte de par exemple 100 femmes.3 On utilise ensuite le concept d’Eve mitochondriale pour comparer, par les méthodes de la génétique des populations (et, en particulier grâce à la formule de Kimura sur le temps de fixation citée plus haut), les différences sur les gènes mitochondriaux entre les différents humains actuels, et avec ceux de leur ancêtre commune. Le but est de reconstituer des phylogénies. Le résultat paraît triplement heureux : De l’ordre de 200.000 ans nous séparent de l’Eve mitochondriale, c’était donc bien une femme ! Pour être fait en si peu de temps, il fallait que le nombre de femmes de son temps fût faible ce qui confirmerait* la thèse que les grands changements évolutifs ne concernent au départ qu’un très petit nombre d’individus.4 Les lignées des non-africains viendraient de lignées africaines. Mais cette troisième affirmation, qui était le but de la communication initiale (1987) de R. Cann* et A. Wilson, largement reprise par les media, ne résulte pas automatiquement de leur travail (il reste concevable que l’homme moderne soit issu de souches et de régions variées). En revanche, des études plus récentes, tant sur les mitochondries que phénotypiques, semblent bien confirmer cette troisième affirmation. 3 Hypothèse extrême (interprétation littérale de la Bible, ou « monstre prometteur » de Goldschmidt) : un seul couple a donné naissance à toute l’humanité. 4 C‘est la position exprimée en 14-4B. Annexe O. Génétique des populations. Page 8. Révision du 21/10/2016 De toute façon, les calculs de génétique peuvent être discutés, puisqu’ils extrapolent une formule, conçue pour des populations stables, à des populations humaines, qui ont peut-être été multipliées par 107 ! De plus, les résultats dépendent des incertitudes d’une horloge moléculaire imprécise. . L’Eve africaine mitochondriale n’est qu’une descendante fortuite des premiers homo sapiens, dont elle n’est pas contemporaine ; elle est plus un artefact de la logique, une vedette médiatisée, qu’une référence scientifique ou qu’une vraie Eve ! De même, l’analyse de l’ADN du chromosome Y, propre aux mâles, permet de remonter la généalogie à un « Adam Ychromosomique ». Il n’aurait vécu qu’il y a 70.000 ans (mais ceci n’est pas un problème puisqu’il s’agit d’un homme et d’une femme, chacun repéré par sa descendance, mais qui n’a aucune raison d’avoir constitué un couple). Ces réserves ne remettent pas en cause l’intérêt d'étudier les gènes des mitochondries ; évoluant plus vite que ceux de l'ADN nucléaire, ils permettent, pour la première fois, d'étudier des évolutions à l'intérieur d'une espèce. Question O-4: N’est-il pas étrange que les gènes mitochondriaux, aux mutations 10 fois plus fréquentes que celles des gènes Y-chromosomiques, semblent s’être fixés plus lentement ? Question O-5 : Y a-t-il eu des études sur d’autres espèces que l’homme ? Si oui, qu’ont elles donné ? Cette évolution rapide des mitochondries empêche-t-elle de plus remonter le temps ? Annexe O. Génétique des populations. Page 9. Révision du 21/10/2016 Question diverse O6. La mutation du gène Ultrabithorax réprime le développement d’ailes chez la drosophile et l’initie chez l’abeille (Futuyma, Evolution, p. 598). Cf. sp-9-4. Une drosophile ayant ce gène, qui lui fait développer des haltères, est-elle viable (Non ?). Annexe O. Génétique des populations. Page 10. Révision du 21/10/2016 Références. Cann, R et als (1-1987), Mitochondrial DNA and Human Evolution. Nature, p. 31-36. Futuyma, D. J. (2013), Evolution. Sinauer. Kimura, Genetics (47), pages 713-719 et (61), pages 763-771. Ce sont de belles mathématiques. Kumar, S et Subramanian, S (2002). Mutation Rates in Mammalian Genomes, in Proceedings of the National Academy of Science, vol 99, p.803-808. Nachman, M et Crowell, S. Estimate of the Mutation Rate per Nucleotide in Humans, in Genetics, Sept 1, 2000, vol 156. Wielgoss et als. (2011), Genetics 1 p.183-186.