Des gènes, des peuples et des langues Luigi l'arbre des apparentements entre les populations humaines est analogue à celui des relations entre les langues parlées dans le monde. Tous deux indiquent une série de migrations à partir d'un berceau probablement africain. 1Ya plus de 40 ans, lorsque j'étudiais la génétique des bactéries dans le laboratoire de Ronald Fisher, à l'Université de Cambridge, mes collègues étaient passionnés de modèles mathématiques. C'est pourquoi j'imaginais alors un projet si ambitieux qu'il paraissait presque fou: la recherche du berceau des populations humaines et la reconstitution des voies de migration par lesquelles elles s'étaient dispersées sur le Globe, à partir de la détermination du degré de parenté des populations actuelles et de l'établissement d'un arbre généalogique complet. Ce but est presque atteint. En analysant les données génétiques humaines accumulées lors des 50 dernières années, ainsi que d'autres résultats mettant en œuvre des techniques génétiques récentes, mes collègues et moi-même avons dressé la carte de la répartition géographique de plusieurs centaines de gènes, et nous en avons déduit les filia- 1 tions des populations humaines. Cet arbre concorde avec un autre arbre établi sur la base de données génétiques entièrement différentes, mais pour un nombre plus restreint de populations, ainsi qu'avec un arbre des familles de langues récemment obtenu. Ainsi les gènes, les populations et les langues semblent avoir simultanément divergé au cours de migrations qui, probablement à partir de l'Afrique, auraient gagné l'Asie, puis l'Europe, le Nouveau Monde et le Pacifique. Pour déterminer l'histoire des populations humaines à partir de leur arbre généalogique, on admet que la différence (ou distance) génétique entre deux populations est d'autant plus grande que leur séparation est plus ancienne (en supposant que toutes les autres forces évolutives sont égales par ailleurs). Les hommes sont parfois classés en groupes ethniques, ou «races» (bien que ce dernier terme ait une connotation détestable en insinuant l'existence CAVALLI-SFORZA d'une hiérarchie raciale), mais on trouve difficilement une définition précise et utile de ces groupes ethniques, car ces derniers évoluent et se chevauchent parfois. Heureusement la classification des langues nous aide à retrouver leurs relations. Durant la majeure partie de sa préhistoire et de son histoire, l'espèce humaine était organisée en tribus, c'està-dire en groupes de personnes étroitement apparentées; ces affiliations tribales sont encore très importantes dans les sociétés traditionnelles. Comme il existe une correspondance étroite entre affiliation tribale et affiliation linguistique, les langues permettent souvent d'identifier les tribus ; ensuite l'affiliation tribale mène à une classification approximative des populations. La situation est plus complexe dans les sociétés urbaines. Aussi, pour simplifier notre étude, nous ne nous sommes intéressés qu'aux populations indigènes, c'est-à-dire celles qui étaient déjà présentes sur leur territoire actuel avant les grandes migrations qui ont suivi les explorations de la Renaissance. Les distances génétiques entre les populations actuelles ne peuvent être calculées sur la base de la seule présence ou de l'absence de caractères génétiques, car chaque population possède presque tout le répertoire des gènes existants. Ce qui différencie les populations, c'est la fréquence observée des divers gènes. ASIATIQUE CAUCASIEN MÉDITERRANÉEN 42 EUROPÉEN DU NORD INDIEN BUSHMEN JU/HUA MASAi PYGMÉE CHINOIS TIBÉTAIN © POUR LA SCIENCE Le facteur Rhésus Ce phénomène apparaît nettement dans le cas du facteur Rhésus (Rh), cet antigène des globules rouges du sang humain qui existe sous deux formes (positive ou négative). Ce caractère est déterminé par un seul gène et, pour des raisons de santé publique, il a été étudié dans des milliers de populations : les médecins doivent identifier les femmes Rhésus négatif et dont le fœtus est Rhésus positif, afin de leur administrer, immédiatement après l'accouchement, un traitement immunologique qui prévient la formation par l'organisme maternel d'anticorps qui agiraient contre les enfants qui seraient conçus ultérieurement. Le gène de l'antigène Rhésus négatif est fréquent en Europe, plus rare en Afrique et en Asie de l'Ouest, et presque absent en Asie de l'Est et chez les populations indigènes d'Amérique et d'Australie (voir lafigure 1). On estime l'apparentement entre deux groupes ethniques en soustrayant les pourcentages d'individus Rhésus négatif de ces deux groupes : par exemple, les Anglais (16 pour cent d'individus Rhésus négatif) diffèrent des Basques (25 pour cent) de 9 pour cent, et des Asiatiques de l'Est de 16 pour cent: dans le second cas, la différence supérieure correspond probablement à une séparation antérieure. En pratique, les généticiens effectuent des opérations un peu plus complexes que la soustraction afin d'obtenir des distances génétiques qui reflètent au mieux l'histoire évolutive des populations. Quand une même population est scindée en plusieurs groupes qui sont totalement isolés les uns des autres, par exemple, ces groupes se différencient génétiquement même en l'absence de mutations et de sélection naturelle : seul le hasard modifie leurs fréquences géniques par un mécanisme de «dérive génétique». En l'absence de forces évolutives particulières, la distance génétique entre deux populations augmente régulière- CORÉEN ARCTIQUE INUIT © POUR LA SCIENCE ment au cours du temps : elle est d'autant plus grande que la divergence entre ces populations est plus ancienne. Les distances génétiques peuvent-elles alors être une sorte d'horloge qui daterait les événements de l'histoire humaine? Difficilement, car des analyses statistiques montrent qu'un seul gène (telle gène Rhésus) est insuffisant pour fournir une chronologie précise. Pour déterminer les distances génétiques, on doit calculer des moyennes sur de nombreux gènes et, idéalement, on devrait comparer les résultats obtenus à ceux qui proviendraient d'autres ensembles de gènes. Fort heureusement, on connaît des milliers de gènes, bien que peu d'entre eux aient été étudiés dans de nombreuses populations. Les distances génétiques conduisent à plusieurs types d'arbres généalogiques. TI y a 27 ans, Anthony Edwards, de Cambridge, et moi avons publié un arbre qui reliait 15 populations en nous fondant sur le principe du «chemin génétique minimal». Comme l'indique le nom de ce principe, dû à A. Edwards, l'arbre établi est celui dont la longueur totale des branches est minimale. Lorsqu'on le projette sur une carte du monde afin que ses extrémités soient situées sur les habitats actuels des populations, cet arbre correspond approximativement aux migrations anciennes reconstituées par les anthropologues (voir la figure 2). On ignore malheureusement si le chemin génétique minimal est la meilleure méthode pour construire un arbre à partir des données génétiques. D'autres méthodes pourraient donner des longueurs de branches plus proportionnelles au temps écoulé et procurer ainsi une meilleure estimation des dates de séparation des divers groupes (voir la figure 3). On peut définir la racine de l'arbre reliant les populations à un groupe extérieur, par exemple au groupe des chimpanzés, dont l'espèce humaine semble s'être séparée il y a cinq à sept millions d'années. Si l'on admet que la vitesse d'évolution est identique sur les différentes branches, leur longueur pourrait être proportionnelle au temps écoulé depuis leur individualisation. Cependant de tels arbres sont erronés si toutes les branches n'ont pas évolué à la même vitesse. Les vitesses d'évolution On minimise les erreurs en utilisant des modèles mathématiques qui permettent d'estimer avec précision les vitesses d'évolution. Le modèle d'évolution que nous avons utilisé est le plus simple: il postule que deux branches évoluent à la même vitesse quand la dérive génétique est la principale force évolutive et quand les populations ont la même taille en moyenne. La première hypothèse a été démontrée par plusieurs observations indépendantes, et la seconde est rendue très probable lorsqu'on choisit les populations de façon adéquate. Les vitesses d'évolution ont des chances d'être constantes pour les grandes populations vivant sur de vastes territoires depuis leur installation originale. Avec Paolo Menozzi, de Parme, et Alberto Piazza, de Turin, j'ai établi une méthode d'analyse commune de l'histoire et de la géographie des gènes humains. Durant 12 ans, nous avons analysé l'ensemble des données génétiques accumulées au cours des 50 dernières années sur plus de 100 caractères génétiques différents, provenant d'environ 3 000 échantillons issus de 1 800 populations ; la plupart de ces échantillons comportaient des centaines ou des milliers d'individus. Ces données (que nous nommerons l' «ensemble classique») sont indirectement dérivées des protéines, les produits des gènes. Récemment nous avons comparé ces données à un second ensemble : des données moléculaires sur les séquences nucléotidiques de l'ADN, c'est-à-dire les gènes eux-mêmes (et non plus les caractères génétiques exprimés par les individus). La plupart de ces données moléculaires ont été collectées durant sept ans par mes collègues de l'Université de AMÉRICAIN AZTÈQUE YANOMANO PACIFIQUE POLYNÉSIEN MAORI MÉLANÉSIEN AUSTRALIEN 43 des fréquences constantes au cours du temps. La racine de l' «arbre mitochondrial» est plus facile à dater que celle de l' «arbre nucléaire» : il suffit de comparer cet arbre à un groupe extérieur - celui des chimpanzés, dans l'étude d'A. Wilson - qui s'est séparé à une date approximativement connue. BASQUE 0-1 0 0 0 0 1-4 L'Ève Africaine 4-9 9-16 16-25 D , 25+ POURCENTAGES D'INDIVIDUS RHÉSUS NÉGATIF 1. CETTE CARTE MONTRE QUE LE FACTEUR RHÉSUS NÉGATIF est le plus fréquent dans la population basque et de moins en moins vers l'Ouest. Par conséquent. les Basques auraient conservé les caractères d'une population européenne primitive, qui se serait ultérieurement mélangée aux immigrants d'origine asiatique. Stanford et par l'équipe de Kenneth et de Judith Kidd, de l'Université Yale. À bien des égards, la qualité des nouvelles données est supérieure à celle de l'ensemble classique, mais elles proviennent de 100 fois moins de populations. Néanmoins, chaque fois que nous avons pu les comparer, ces données moléculaires concordaient parfaitement avec les données de l'ensemble classique. Un berceau africain Notre premier résultat confirme l'étude des fossiles et des vestiges culturels humains: l'Afrique fut le berceau de l'espèce humaine. En effet, les distances génétiques entre les Africains et les non-Africains sont les plus grandes de toutes, ce qui se comprend si la divergence africaine a été la première et la plus ancienne. La distance génétique entre les Africains et les non-Africains est environ le double de la distance entre les Australiens et les Asiatiques, qui est elle-même plus de deux fois supérieure à la distance entre les Européens et les Asiatiques. Les paléo-anthropologues ont déterminé des dates de séparation de ces diverses populations qui sont proportionnelles aux distances génétiques : les Asiatiques se sont séparés des Africains il y a 100 000 ans, les Australiens des Asiatiques il y a 50 000 ans, et les Européens des Asiatiques il y a entre 35 000 et 40 000 ans. Dans ces exemples, les distances génétiques sont des horloges biologiques admissibles. 44 Allan Wilson et ses collègues de l'Université de Berkeley ont daté l'arbre humain à partir de données génétiques différentes des nôtres, et leurs principaux résultats, publiés vers la fin de notre première étude, ont globalement confirmé nos résultats. L'équipe de Berkeley a étudié les quelques gènes qui sont codés par l'ADN mitochondrial (les mitochondries sont les organites cellulaires qui produisent l'énergie cellulaire). À Stanford, nous avions aussi commencé à étudier les gènes mitochondriaux, mais nos méthodes étaient bien moins précises. L'hérédité mitochondriale est très particulière. D'une part, alors que chaque individu reçoit autant de gènes nucléaires de son père que de sa mère, les gènes mitochondriaux sont transmis presque exclusivement par la mère : cette transmission quasi unilatérale simplifie considérablement le calcul des distances génétiques. D'autre part, les mutations des gènes mitochondriaux sont beaucoup plus fréquentes que les mutations des gènes nucléaires, de sorte que l'on peut calculer les distances génétiques à partir du nombre de mutations et non plus à partir des fréquences des gènes. L'utilisation d'une horloge mitochondriale, correspondant au nombre de mutations qui se sont accumulées dans les gènes mitochondriaux et non aux variations des fréquences géniques, impose le recours à des hypothèses différentes de celles que nous avons considérées. Notamment l'équipe d'A. Wilson a supposé que les mutations des gènes mitochondriaux se produisent à L'arbre mitonchondrial établi à Berkeley présente une plus grande différenciation en Afrique que partout ailleurs : par conséquent, ce serait en Afrique que l'ADNmitochondrial humain aurait évolué le plus longtemps. On a même fait remonter cet ADNmitochontridal à une seule femme, l' «Ève» africaine, mais nous verrons plus loin que ce terme est inapproprié. En comparant l'ADN mitochondrial humain à celui des chimpanzés, les généticiens ont daté la racine de cet arbre, puis estimé la date de divergence des divers embranchements; en outre, ils ont estimé que l'ancêtre africaine avait vécu il y a 150 000 à 200 000 ans, ce qui confirmait nos résultats, obtenus par une approche très différente. Récemment cette datation a été révisée, mais elle reste antérieure à la date que nous avons estimée pour la divergence des populations africaine et asiatique, il y a 100 000 ans environ. TI est d'ailleurs logique qu'elle soit plus ancienne, car les deux dates sont celles d'événements différents: l'un est la naissance d'une femme, et l'autre la scission d'une population à laquelle appartenait cette femme. Cependant une équivoque est née de l'emploi du nom d' «Ève» pour désigner l'ancêtre d'où nous tirons notre ADN mitochondrial: rien ne prouve qu'il y ait jamais eu une époque où une seule femme vivait sur la Terre; de nombreuses autres femmes vivaient probablement à la même époque, mais leurs gènes mitochondriaux auraient disparu. Certaines des conclusions examinées précédemment sont controversées. Si les paléo-anthropologues s'accordent sur l'origine africaine du genre Homo, il y a 2,5 millions d'années, et si les fossiles découverts montrent que l' Homo sapiens, d'anatomie semblable à la nôtre, est apparu en Afrique ou à proximité de celle-ci il y a 100 000 ans environ, tous les spécialistes ne sont pas d'accord avec la théorie d'un exode à partir de l'Afrique ; certains avancent notamment que l'homme moderne est apparu bien plus tôt et simultanément dans plusieurs populations de l'Ancien Monde. © POUR LA SCIENCE Les migrations humaines Les études de génétique des populations donnent de précieuses informations sur l'histoire des migrations successives et sur l'origine des populations actuelles. La confrontation de nos résultats avec ceux des linguistes et des archéologues semble prometteuse. En général, les migrations résultent des changements de l'environnement qui sont soit des contraintes, soit des opportunités. À plusieurs reprises, les populations d'hominidés, puis d'êtres humains se sont développées - probablement après des progrès culturels - et ont alors colonisé de nouveaux territoires. Les vestiges archéologiques (des ossements et des outils de pierre, essentiellement) semblent confirmer que le berceau des hominidés était l'Afrique; de là, les hominidés auraient migré, probablement il y a un million d'années, vers l'Asie, via l'isthme de Suez, puis de l'Asie vers l'Europe. La reconstitution de l'étape suivante est plus difficile parce que les résultats dépendent de l'époque à laquelle on considère que l'homme moderne est apparu. Cependant cette apparition est incontestablement antérieure aux premières migrations de l'Asie vers le continent américain, migrations qui n'ont pu se produire que lorsque le détroit de Béring s'est asséché et que le climat s'est adouci. Quant à la colonisation de l'Australie et des îles du Pacifique, elle doit être assez récente, puisqu'elle n'eut lieu qu'après la découverte de la migration maritime. L -~/ :. j "- - \. .:». t "- ,j LES NOMBRES INDIQUENT LES DATES ESTIMÉES DES PREMIÈRES COLONISATIONS ~ 2. LES GÈNES ET LES PIERRES racontent la même histoire. Le premier arbre génétique établi (en rouge) a été projeté sur une carte du monde, de sorte que ses extrémités soient situées sur les habitats actuels des populations indigènes (les points violets). Des études ~!!!!!!!!!!!!!!!!!!!!!I!!!!!!!!!!!!o \:==~~~~ . AUSTRALIEN 500 ~ ASIATIQUE DU NORD-EST ASIATIQUE DU NORD-EST ARCTIQUE ~!!!!!I!!!!!!!!!!!!!_ AMÉRINDIEN 1 0,05 CAUCASIEN 1 0,00 3. Au COURS DU TEMPS, les populations subissent une différenciation· génétique, comme celle qui figure dans cet arbre généalogique d'une famille ethnique (à gaucheJ. Cette dérive génétique est simulée sur © POUR LA SCIENCE 1 000 1 500 2 000 2 500 ÎLES DU PACIFIQUE ASIATIQUE DU SUD-EST ~::;;;;=:;;;;;;;::;:::;;::::;~=::;:;;;œ:::::':il:l1l!œ!l AFRICAIN 1 0,10 TEMPS (EN ANNÉES) ET NÉO-GUINÉEN ,...--, ~:;::=;:=::t:= .'", génétiques plus récentes révèlent deux voies de migration de l'Afrique vers l'Asie Ues flèches rouges) ; toutefois certains trajets restent encore mal connus. On a indiqué, à côté de ces voies de migration, les dates des premières colonisations. .mw ~ 5 EUROPÉEN 1 0,15 ,/ /" NON-AFRICAIN ~ § -lU fE ordinateur (à droite). Lorsque les deux moitiés d'une population se séparent, elles ont des fréquences géniques égales, mais le temps et le hasard modifient parfois ces fréquences dans des sens opposés. 45 L'Australie semble avoir été colonisée par des groupes venant d'Asie du Sud-Est, il y a environ 40 000 à 60 000 ans. Le peuplement du continent américain est plus difficile à dater : en Alaska, le premier vestige connu de présence humaine remonte à près de 15000 ans, alors qu'en Amérique du Sud l'occupation humaine semble plus ancienne (entre 15 000 et 35 000 ans). Les résultats de nos études génétiques indiquent que la colonisation de l'Amérique date d'il y a 30 000 ans environ. L'Europe, enfin, fut balayée par de nombreuses vagues migratoires, mais les vestiges des premières occupations ont subsisté. En 1954, à Londres, Arthur Mourant réalisa l'une des premières études de la géographie des gènes en proposant que les Basques étaient les plus anciens habitants d'Europe, qui auraient conservé une partie de leur constitution génétique primitive malgré leurs contacts avec les immigrants ultérieurs. Cette hypothèse se fondait sur les analyses du gène Rhésus négatif, qui est beaucoup plus fréquent chez les Basques que chez toute autre population dans le monde. Cette théorie fut confirmée par des analyses d'autres gènes et par des études linguistiques : la langue basque diffère notablement des langues des peuples voisins. Une analyse récente des variations génétiques en Europe a permis d'élaborer un modèle de la colonisation de l'Europe: les premiers agriculteurs du Néolithique, venus du Moyen-Orient, apportèrent en Europe leurs gènes, leur culture et leurs langues indo-européennes par un lent processus d'expansion (voir La dispersion des langues indo-européennes, par Colin Renfrew, dans ce dossier). Les ancêtres des Basques, à l'extrémité de ce chemin migratoire, se mélangèrent peu aux nouveaux immigrants. TIfaut cependant noter que l'analyse génétique des populations ne permet de reconstituer que les migrations qui ont eu un impact génétique décelable. Par exemple, avant les Portugais et les Espagnols, les Vikings ont probablement établi de brèves colonies en Amérique, mais leur contribution génétique locale n'a pas pu être déterminée. Ayant observé une étonnante correspondance entre la répartition des gènes et celle des langues, nous avons cherché des cas où une langue ou une famille de langues permettait d'identifier une population génétique. 46 CORRESPONDANCES ENTRE LES PEUPLES ET LES LANGUES RELATIONS GÉNÉTIQUES ,.---__--------------------A~-------------------- DISTANCE 0,030 __ GÉNÉTIQUE 0,024 0,018 0,012 0,006 © POUR LA SCIENCE 0,000 La concordance des arbres génétique et linguistique POPULATIONS r- -....., -- PYGMÉE MBUTI • m;;r (ORIGINE •••• INCONNUE) OUEST-AFRICAIN NIGER-KORDOFADIEN BANTOU NILOTIQUE ""'" LINGUISTIQUE BUSHMEN NILO-SAHARIEN (SAN) KHOisAN BERBÈRE, N. AFRICAIN AFRO-ASIAT IQUE ASIATIQUE DU S.-O. ÉTHIOPIEN "- ~ IRANIEN ~ EUROPÉEN INDO-EURO PÉEN SARDIEN INDIEN INDIEN DU S.-E. DRAVIDIEN CIl )- LAPON C "U m OURALIQUE :Il SAMOYÈDE ZCIl OC CIl"U MONGOLE -lm :Il:Il TIBÉTAIN ~~H~ ~ SINO-TIBÉT AIN O~ Cr CORÉEN mm JAPONAIS ALTAïQUE SIBÉRIEN ESKIMO ESKIMO-AL ÉOUTE TCHOUKTCHE TCHOUKTC HI-KAMTCHADAL AMÉRINDIEN DU S. AMÉRINDIEN CENTRE AMÉRINDIEN DU N. AMÉRINDIEN DU N.-O. AMÉRINDIEN SI NO-TIBÉTAIN : ·· · KHMER THAï DAïAK ê g) "U ••• --------i1l MALAYSIEN •• AUSTRONÉSIEN PHILIPPiN I2 ~ >-~ INDONÉSIEN __ ~~~."",d' ~ :t> 1 C 1 ~ 5 C Ir POLYNÉSIEN ~ MICRONÉSIEN MÉLANÉSIEN NÉO-GUINÉEN AUSTRALIEN ~ ),0 © POUR LA SCIENCE m -_ •.>- INDO-PACIFIQUE AUSTRALIEN r m m C :Il :t> CIl m NA-DÉNÉ AUSTRO-ASIATIQUE = o C · ......•.•....•••· CHINOIS DU SUD s: ~ ·· ·· ·· AiNOU I2 Les quelque 400 langues de la famille bantoue, au centre et au Sud de l'Afrique, correspondent étroitement aux frontières tribales et aux affiliations génétiques de ces tribus. Joseph Greenberg, à l'Université Stanford, a proposé une explication de cette correspondance dans les années 1950, et il a convaincu la plupart des spécialistes. Les langues bantoues dériveraient d'une seule langue ou d'un petit nombre de dialectes très proches, parlés par les premiers agriculteurs de l'Est du Nigeria et du Cameroun. Quand ces agriculteurs ont ensuite migré vers l'Afrique centrale et vers le Sud de l'Afrique, il y a 3 000 ans ou plus, leurs langues ont divergé sans toutefois oblitérer leur origine commune (voir Les migrations des populations bantoues, par D. Phillipson, dans ce dossier). Comme cette explication vaut aussi pour leurs gènes, le mot bantou - qui désignait initialement une famille linguistique - est aujourd'hui également appliqué au groupe génétique. En 1988, nous avons publié un arbre représentant l'apparentement génétique et linguistique de 42 populations du Globe : la correspondance entre les groupements génétiques de ces populations et les groupements linguistiques est flagrante. À de rares exceptions près, les familles linguistiques semblent d'origine récente dans notre arbre génétique. En outre, deux équipes de linguistes ont récemment regroupé les familles de langues en «superfamilles» qui s'accordent avec nos résultats génétiques. Ainsi se trouve vérifiée une conjecture proposée par Darwin, en 1859, dans son fameux ouvrage De l'origine des espèces au moyen de la sélection naturelle (chapitre 14) : on peut prévoir l'évolution linguistique des populations à partir de leur arbre génétique. Pourquoi les évolutions linguistique et génétique sont-elles si parallèles? La réponse est dans l'histoire des populations et non dans la génétique, car si les gènes ne déterminent pas le langage, les circonstances qui entourent la naissance des individus déterminent la langue qu'ils apprendront. Inversement les différences linguistiques peuvent parfois créer ou renforcer des barrières génétiques entre les populations, bien qu'elles ne soient pas la cause première du parallélisme. L'histoire humaine est ponctuée par des scissions de populations en sous-groupes, qui s'installent 47 parfois loin de leur lieu d'origine; les gènes et les langues de chaque sousgroupe évoluent tout en conservant la trace de leur origine commune, de sorte que la correspondance entre les gènes et les langues est inévitable. Les séparations complètes lorsque, par exemple, un sous-groupe migre vers un nouveau continent, sont rares, mais des montagnes ou des océans ne sont pas indispensables pour isoler deux populations : l'étude génétique de nombreuses espèces animales ou végétales montre que la distance suffit. Puisque les échanges entre deux populations sont d'autant plus importants que ces populations sont géographiquement proches, la distance génétique entre deux populations devrait augmenter avec la distance géographique. TIen va de même pour les langues. Lorsqu'aucune barrière ne bloque les échanges, les variations génétiques et linguistiques sont continues ; inversement, la présence d'un obstacle à la migration provoque une discontinuité dans les variations génétiques et linguistiques. Les substitutions de langues et de gènes La correspondance entre les langues et les gènes souffre de deux exceptions : la substitution de langues et la substitution de gènes. La première résulte de l'abandon d'une langue ancestrale au profit d'une nouvelle langue - celle d'immigrants, de conquérants ou d'une nouvelle élite culturelle ; une telle substitution linguistique est d'autant plus rare que la nouvelle langue diffère davantage de la langue originelle. Le basque est un cas extrême de langue ayant survécu durant des milliers d'années, alors que les langues des populations voisines ont constamment évolué. La substitution des gènes, généralement partielle, se produit lorsque deux populations se mélangent. Quand ce mélange est progressif, il modifie dans la même proportion la fréquence relative de tous les gènes. Alors que la substitution génique est graduelle, la substitution linguistique obéit généralement à la loi du tout ou rien. En effet, une langue conserve son intégrité ancestrale même lorsqu'elle emprunte beaucoup de mots à une autre famille ou à une autre sous-famille linguistique. Les linguistes admettent, par exemple, que l'anglais dérive d'une sous-famille germanique malgré ses emprunts au français, au grec et au latin. Ce sont les 48 structures -syntaxiques et le vocabulaire de base qui définissent la langue. La différence entre la substitution génique et la substitution linguistique a une conséquence importante : une minorité conquérante imposera à une majorité conquise une nouvelle langue, qui se substituera presque entièrement à l'ancienne, mais les nouveaux gènes ne se substitueront aux anciens qu'en proportion des populations de conquérants et de conquis : ainsi les Hongrois parlent une langue originaire de l'Oural, qui leur fut imposée par les conquérants magyars au Moyen Âge, mais la plupart de leurs gènes sont d'origine européenne, et la population actuelle ne présente que des traces infimes de gènes magyars. Les substitutions complètes de gènes sont rares, mais nous en avons découvert au moins un exemple dans nos arbres génétique et linguistique : les Lapons, qui vivent au Nord de la Scandinavie, parlent aussi une langue ouralique, mais leurs gènes semblent résulter d'un brassage entre des populations mongoles de Sibérie et des populations scandinaves, dont la contribution est majoritaire. Ce brassage transparaît dans la chevelure et dans la couleur de peau des Lapons, qui passent par toutes les nuances claires et foncées. De même, les Éthiopiens résulteraient d'un mélange génétique entre des populations africaines, qui prédominent, et des populations caucasoïdes d'Arabie. Même limité, un apport de gènes produit un effet important s'il se poursuit suffisamment longtemps. Par exemple, les Américains d'origine africaine possèdent aujourd'hui 30 pour cent de gènes d'origine européenne; cette proportion aurait été obtenue si cinq pour cent environ des Noirs américains s'étaient unis avec un Américain d'origine européenne, à chaque génération depuis l'introduction de l'esclavage en Amérique et en considérant tous les métis comme noirs. Si ce métissage se poursuit au même rythme durant un millier d'années, il ne restera pas grandchose de la composante génétique africaine originelle en Amérique. En définitive, il est même surprenant que la correspondance entre les gènes et les langues subsiste en dépit des substitutions génétique et linguistique. Cette conservation est partiellement due au fait que notre étude ne porte que sur des populations indigènes, mais des études récentes confirment l'existence de la correspondance à une échelle microgéographique. Par exemple, notre arbre génétique des premiers Américains concorde avec la classification des langues du Nouveau Monde établie récemment par J. Greenberg, qui distingue trois grandes familles linguistiques : ces deux études, menées indépendamment à partir de données différentes, montrent que la colonisation du continent américain résulte d'un petit nombre de migrations distinctes et successives. En fait, les gènes et la culture sont probablement liés pour une autre raison : dans les sociétés traditionnelles que nous avons étudiées, la transmission de la culture reste essentiellement verticale (des parents aux enfants). Alors que les gènes se transmettent toujours verticalement, la culture est transmise à la fois verticalement, de génération en génération, et horizontalement, entre personnes non apparentées. Par exemple, à chaque saison, la haute couture parisienne est diffusée dans le monde entier (bien que la mode italienne commence aussi à s'imposer). Aujourd'hui la transmission horizontale prend une importance croissante, alors que, dans les sociétés traditionnelles, la transmission est essentiellement verticale, ce qui rend ces sociétés plus conservatrices. Les substitutions génétique et linguistique, avec leurs lois particulières, sont davantage que des exceptions à notre modèle : elles peuvent fournir de précieuses informations sur l'évolution des populations et des langues et sur le développement de la culture humaine. Leur étude compléterait utilement notre travail, et les anthropologues auraient intérêt à se mettre à l'ouvrage avant que les populations indigènes ne perdent leur identité. D'autre part, les biologistes, devraient profiter du Projet d'étude du génome humain pour recenser la diversité génétique humaine avant qu'elle ne disparaisse. Luigi Luca CAVALLI-SFORZA enseigne génétique à l'Université Stanford. la L.L. CAVALLI-SFORZA, Qui sommes-nous, Rammarion, 1997. AM. BOWCOCK et al., Drift, Admixture and Selection in Human Evolution: A Study with dna Polymophisms, in Proceedings of the National Academy of Sciences, vol. 88, n° 3, pp. 839-843, 1er février 1991. LL CAVAW-SFORZAet al., Reconstruction of Human Evolution : Bringing together Genetk; Archaeological and Unguistic Data, in Proceedings of the National Academy of Sciences, vol. 85, n° 16, pp. 6 002-6 006, août 1988. © POUR LA SCIENCE