Des gènes, des peuples
et des langues
l'arbre des apparentements entre les populations
humaines est analogue
à
celui des relations
entre les langues parlées dans le monde.
Tous deux indiquent une série de migrations
à
partir d'un berceau probablement africain.
1
1Ya plus de 40 ans, lorsque j'étu-
diais la génétique des bactéries
dans le laboratoire de Ronald
Fisher, à l'Université de Cam-
bridge, mes collègues étaient passion-
nés de modèles mathématiques. C'est
pourquoi j'imaginais alors un projet si
ambitieux qu'il paraissait presque fou:
la recherche du berceau des populations
humaines et la reconstitution des voies
de migration par lesquelles elles
s'étaient dispersées sur le Globe, à par-
tir de la détermination du degré de
parenté des populations actuelles et de
l'établissement d'un arbre généalogique
complet.
Ce but est presque atteint. En analy-
sant les données génétiques humaines
accumulées lors des 50 dernières
années, ainsi que d'autres résultats met-
tant en œuvre des techniques génétiques
récentes, mes collègues et moi-même
avons dressé la carte de la répartition
géographique de plusieurs centaines de
gènes, et nous en avons déduit les filia-
tions des populations humaines. Cet
arbre concorde avec un autre arbre éta-
bli sur la base de données génétiques
entièrement différentes, mais pour un
nombre plus restreint de populations,
ainsi qu'avec un arbre des familles de
langues récemment obtenu. Ainsi les
gènes, les populations et les langues
semblent avoir simultanément divergé
au cours de migrations qui, probable-
ment à partir de l'Afrique, auraient
gagné l'Asie, puis l'Europe, le Nouveau
Monde et le Pacifique.
Pour déterminer l'histoire des popu-
lations humaines à partir de leur arbre
généalogique, on admet que la diffé-
rence (ou distance) génétique entre deux
populations est d'autant plus grande que
leur séparation est plus ancienne (en
supposant que toutes les autres forces
évolutives sont égales par ailleurs).
Les hommes sont parfois classés en
groupes ethniques, ou «races» (bien que
ce dernier terme ait une connotation
détestable en insinuant l'existence
MÉDITERRANÉEN INDIEN MASAi CHINOIS
CAUCASIEN
EUROPÉEN
DU NORD BUSHMEN
JU/HUA
Luigi
CAVALLI-SFORZA
d'une hiérarchie raciale), mais on
trouve difficilement une définition pré-
cise et utile de ces groupes ethniques,
car ces derniers évoluent et se chevau-
chent parfois. Heureusement la classifi-
cation des langues nous aide à retrouver
leurs relations.
Durant la majeure partie de sa pré-
histoire et de son histoire, l'espèce
humaine était organisée en tribus, c'est-
à-dire en groupes de personnes étroite-
ment apparentées; ces affiliations tri-
bales sont encore très importantes dans
les sociétés traditionnelles. Comme il
existe une correspondance étroite entre
affiliation tribale et affiliation linguis-
tique, les langues permettent souvent
d'identifier les tribus ; ensuite l'affilia-
tion tribale mène à une classification
approximative des populations.
La situation est plus complexe dans
les sociétés urbaines. Aussi, pour sim-
plifier notre étude, nous ne nous
sommes intéressés qu'aux populations
indigènes, c'est-à-dire celles qui étaient
déjà présentes sur leur territoire actuel
avant les grandes migrations qui ont
suivi les explorations de la Renais-
sance. Les distances génétiques entre
les populations actuelles ne peuvent
être calculées sur la base de la seule
présence ou de l'absence de caractères
génétiques, car chaque population pos-
sède presque tout le répertoire des
gènes existants. Ce qui différencie les
populations, c'est la fréquence obser-
vée des divers gènes.
ASIATIQUE
PYGMÉE TIBÉTAIN
42
©POUR
LA SCIENCE
Le facteur Rhésus
Ce phénomène apparaît nettement dans
le cas du facteur Rhésus (Rh), cet anti-
gène des globules rouges du sang
humain qui existe sous deux formes
(positive ou négative). Ce caractère est
déterminé par un seul gène et, pour des
raisons de santé publique, il a été étudié
dans des milliers de populations : les
médecins doivent identifier les femmes
Rhésus négatif et dont le fœtus est
Rhésus positif, afin de leur administrer,
immédiatement après l'accouchement,
un traitement immunologique qui pré-
vient la formation par l'organisme
maternel d'anticorps qui agiraient contre
les enfants qui seraient conçus ultérieu-
rement. Le gène de l'antigène Rhésus
négatif est fréquent en Europe, plus rare
en Afrique et en Asie de l'Ouest, et
presque absent en Asie de l'Est et chez
les populations indigènes d'Amérique et
d'Australie (voir lafigure 1).
On estime l'apparentement entre
deux groupes ethniques en soustrayant les
pourcentages d'individus Rhésus négatif
de ces deux groupes : par exemple, les
Anglais (16 pour cent d'individus Rhésus
négatif) diffèrent des Basques (25 pour
cent) de 9 pour cent, et des Asiatiques de
l'Est de 16pour cent: dans le second cas,
la différence supérieure correspond pro-
bablement à une séparation antérieure.
En pratique, les généticiens effec-
tuent des opérations un peu plus com-
plexes que la soustraction afin d'obtenir
des distances génétiques qui reflètent au
mieux l'histoire évolutive des popula-
tions. Quand une même population est
scindée en plusieurs groupes qui sont
totalement isolés les uns des autres, par
exemple, ces groupes se différencient
génétiquement même en l'absence de
mutations et de sélection naturelle : seul
le hasard modifie leurs fréquences
géniques par un mécanisme de «dérive
génétique».
En l'absence de forces évolutives
particulières, la distance génétique entre
deux populations augmente régulière-
ment au cours du temps : elle est
d'autant plus grande que la divergence
entre ces populations est plus ancienne.
Les distances génétiques peuvent-elles
alors être une sorte d'horloge qui date-
rait les événements de l'histoire
humaine? Difficilement, car des ana-
lyses statistiques montrent qu'un seul
gène (telle gène Rhésus) est insuffisant
pour fournir une chronologie précise.
Pour déterminer les distances géné-
tiques, on doit calculer des moyennes
sur de nombreux gènes et, idéalement,
on devrait comparer les résultats obte-
nus à ceux qui proviendraient d'autres
ensembles de gènes. Fort heureusement,
on connaît des milliers de gènes, bien
que peu d'entre eux aient été étudiés
dans de nombreuses populations.
Les distances génétiques conduisent à
plusieurs types d'arbres généalogiques.
TI
y a 27 ans, Anthony Edwards, de
Cambridge, et moi avons publié un arbre
qui reliait 15 populations en nous fondant
sur le principe du «chemin génétique
minimal». Comme l'indique le nom de ce
principe, à A. Edwards, l'arbre établi
est celui dont la longueur totale des
branches est minimale. Lorsqu'on le pro-
jette sur une carte du monde afin que ses
extrémités soient situées sur les habitats
actuels des populations, cet arbre corres-
pond approximativement aux migrations
anciennes reconstituées par les anthropo-
logues (voir lafigure 2). On ignore mal-
heureusement si le chemin génétique
minimal est la meilleure méthode pour
construire un arbre à partir des données
génétiques. D'autres méthodes pourraient
donner des longueurs de branches plus
proportionnelles au temps écoulé et pro-
curer ainsi une meilleure estimation des
dates de séparation des divers groupes
(voir la figure 3). On peut définir la
racine de l'arbre reliant les populations à
un groupe extérieur, par exemple au
groupe des chimpanzés, dont l'espèce
humaine semble s'être séparée il y a cinq
à sept millions d'années. Si l'on admet
que la vitesse d'évolution est identique
sur les différentes branches, leur longueur
pourrait être proportionnelle au temps
écoulé depuis leur individualisation.
Cependant de tels arbres sont erronés si
toutes les branches n'ont pas évolué à la
même vitesse.
Les vitesses d'évolution
On minimise les erreurs en utilisant des
modèles mathématiques qui permettent
d'estimer avec précision les vitesses
d'évolution. Le modèle d'évolution que
nous avons utilisé est le plus simple: il
postule que deux branches évoluent à la
même vitesse quand la dérive génétique
est la principale force évolutive et
quand les populations ont la même taille
en moyenne. La première hypothèse a
été démontrée par plusieurs observa-
tions indépendantes, et la seconde est
rendue très probable lorsqu'on choisit
les populations de façon adéquate. Les
vitesses d'évolution ont des chances
d'être constantes pour les grandes popu-
lations vivant sur de vastes territoires
depuis leur installation originale.
Avec Paolo Menozzi, de Parme, et
Alberto Piazza, de Turin, j'ai établi une
méthode d'analyse commune de l'his-
toire et de la géographie des gènes
humains. Durant 12 ans, nous avons
analysé l'ensemble des données géné-
tiques accumulées au cours des 50 der-
nières années sur plus de 100 caractères
génétiques différents, provenant d'envi-
ron 3 000 échantillons issus de
1 800 populations ; la plupart de ces
échantillons comportaient des centaines
ou des milliers d'individus. Ces don-
nées (que nous nommerons l' «ensemble
classique») sont indirectement dérivées
des protéines, les produits des gènes.
Récemment nous avons comparé ces
données à un second ensemble : des
données moléculaires sur les séquences
nucléotidiques de l'ADN,c'est-à-dire les
gènes eux-mêmes (et non plus les carac-
tères génétiques exprimés par les indivi-
dus). La plupart de ces données molécu-
laires ont été collectées durant sept ans
par mes collègues de l'Université de
CORÉEN INUIT AZTÈQUE AUSTRALIEN
-
ARCTIQUE AMÉRICAIN PACIFIQUE
YANOMANO POLYNÉSIEN MAORI MÉLANÉSIEN
©
POUR LA
SCIENCE 43
BASQUE
0-1
0
1-4
0
4-9
0
9-16
0
16-25
D
25+
POURCENTAGES
D'INDIVIDUS RHÉSUS NÉGATIF
,
1.
CETTE CARTE MONTRE QUE LE FACTEUR RHÉSUS NÉGATIF
est le plus fréquent dans la popu-
lation basque et de moins en moins vers l'Ouest. Par conséquent. les Basques auraient
conservé les caractères d'une population européenne primitive, qui se serait ultérieurement
mélangée aux immigrants d'origine asiatique.
Stanford et par l'équipe de Kenneth et
de Judith Kidd, de l'Université Yale. À
bien des égards, la qualité des nouvelles
données est supérieure à celle de
l'ensemble classique, mais elles provien-
nent de 100 fois moins de populations.
Néanmoins, chaque fois que nous avons
pu les comparer, ces données molécu-
laires concordaient parfaitement avec les
données de l'ensemble classique.
Un berceau africain
Notre premier résultat confirme l'étude
des fossiles et des vestiges culturels
humains: l'Afrique fut le berceau de
l'espèce humaine. En effet, les distances
génétiques entre les Africains et les
non-Africains sont les plus grandes de
toutes, ce qui se comprend si la diver-
gence africaine a été la première et la
plus ancienne.
La distance génétique entre les
Africains et les non-Africains est envi-
ron le double de la distance entre les
Australiens et les Asiatiques, qui est
elle-même plus de deux fois supérieure
à
la distance entre les Européens et les
Asiatiques. Les paléo-anthropologues
ont déterminé des dates de séparation de
ces diverses populations qui sont propor-
tionnelles aux distances génétiques : les
Asiatiques se sont séparés des Africains
il y a 100 000 ans, les Australiens des
Asiatiques il y a 50 000 ans, et les
Européens des Asiatiques il y a entre
35 000 et 40 000 ans. Dans ces
exemples, les distances génétiques sont
des horloges biologiques admissibles.
44
Allan Wilson et ses collègues de
l'Université de Berkeley ont daté l'arbre
humain
à
partir de données génétiques
différentes des nôtres, et leurs principaux
résultats, publiés vers la fin de notre pre-
mière étude, ont globalement confirmé
nos résultats. L'équipe de Berkeley a étu-
dié les quelques gènes qui sont codés par
l'ADN
mitochondrial (les mitochondries
sont les organites cellulaires qui produi-
sent l'énergie cellulaire). ÀStanford,
nous avions aussi commencé à étudier les
gènes mitochondriaux, mais nos
méthodes étaient bien moins précises.
L'hérédité mitochondriale est très
particulière. D'une part, alors que chaque
individu reçoit autant de gènes nucléaires
de son père que de sa mère, les gènes
mitochondriaux sont transmis presque
exclusivement par la mère : cette trans-
mission quasi unilatérale simplifie consi-
dérablement le calcul des distances géné-
tiques. D'autre part, les mutations des
gènes mitochondriaux sont beaucoup
plus fréquentes que les mutations des
gènes nucléaires, de sorte que l'on peut
calculer les distances génétiques à partir
du nombre de mutations et non plus à
partir des fréquences des gènes.
L'utilisation d'une horloge mito-
chondriale, correspondant au nombre de
mutations qui se sont accumulées dans
les gènes mitochondriaux et non aux
variations des fréquences géniques,
impose le recours à des hypothèses dif-
férentes de celles que nous avons consi-
dérées. Notamment l'équipe d'A. Wil-
son a supposé que les mutations des
gènes mitochondriaux se produisent à
des fréquences constantes au cours du
temps. La racine de l' «arbre mitochon-
drial» est plus facile
à
dater que celle de
l' «arbre nucléaire» : il suffit de compa-
rer cet arbre à un groupe extérieur
- celui des chimpanzés, dans l'étude
d'A. Wilson - qui s'est séparé à une
date approximativement connue.
L'ÈveAfricaine
L'arbre mitonchondrial établi à Berkeley
présente une plus grande différenciation
en Afrique que partout ailleurs : par
conséquent, ce serait en Afrique que
l'ADNmitochondrial humain aurait évolué
le plus longtemps. On a même fait
remonter cet ADNmitochontridal
à
une
seule femme, l' «Ève» africaine, mais
nous verrons plus loin que ce terme est
inapproprié. En comparant l'ADNmito-
chondrial humain
à
celui des chimpanzés,
les généticiens ont daté la racine de cet
arbre, puis estimé la date de divergence
des divers embranchements; en outre, ils
ont estimé que l'ancêtre africaine avait
vécu il y a 150 000 à 200 000 ans, ce qui
confirmait nos résultats, obtenus par une
approche très différente. Récemment
cette datation a été révisée, mais elle reste
antérieure à la date que nous avons esti-
mée pour la divergence des populations
africaine et asiatique, il y a 100 000 ans
environ.
TI
est d'ailleurs logique qu'elle
soit plus ancienne, car les deux dates sont
celles d'événements différents: l'un est
la naissance d'une femme, et l'autre la
scission d'une population à laquelle
appartenait cette femme.
Cependant une équivoque est née de
l'emploi du nom d' «Ève» pour désigner
l'ancêtre d'où nous tirons notre ADN
mitochondrial: rien ne prouve qu'il
y
ait
jamais eu une époque où une seule
femme vivait sur la Terre; de nom-
breuses autres femmes vivaient proba-
blement
à
la même époque, mais leurs
gènes mitochondriaux auraient disparu.
Certaines des conclusions examinées
précédemment sont controversées. Si les
paléo-anthropologues s'accordent sur
l'origine africaine du genre Homo, il
y
a
2,5 millions d'années, et si les fossiles
découverts montrent que l' Homo
sapiens, d'anatomie semblable à la nôtre,
est apparu en Afrique ou
à
proximité de
celle-ci il y a 100 000 ans environ, tous
les spécialistes ne sont pas d'accord avec
la théorie d'un exode àpartir de
l'Afrique ; certains avancent notamment
que l'homme moderne est apparu bien
plus tôt et simultanément dans plusieurs
populations de l'Ancien Monde.
©POUR LA SCIENCE
Les migrations humaines
Les études de génétique des populations
donnent de précieuses informations sur
l'histoire des migrations successives et
sur l'origine des populations actuelles.
La confrontation de nos résultats avec
ceux des linguistes et des archéologues
semble prometteuse.
En général, les migrations résultent
des changements de l'environnement qui
sont soit des contraintes, soit des opportu-
nités.
À
plusieurs reprises, les populations
L
:. j
LES NOMBRES INDIQUENT LES DATES
ESTIMÉES DES PREMIÈRES COLONISATIONS
d'hominidés, puis d'êtres humains se sont
développées - probablement après des
progrès culturels - et ont alors colonisé
de nouveaux territoires. Les vestiges
archéologiques (des ossements et des
outils de pierre, essentiellement) sem-
blent confirmer que le berceau des homi-
nidés était l'Afrique; de là, les hominidés
auraient migré, probablement il ya un
million d'années, vers l'Asie, via l'isthme
de Suez, puis de l'Asie vers l'Europe.
La reconstitution de l'étape suivante
est plus difficile parce que les résultats
2. LES GÈNES ET LES PIERRES racontent la même histoire. Le premier
arbre génétique établi (en rouge) a été projeté sur une carte du
monde, de sorte que ses extrémités soient situées sur les habitats
actuels des populations indigènes (les points violets). Des études
~!!!!!!!!!!!!!!!!!!!!!I!!!!!!!!!!!!o AUSTRALIEN ET NÉO-GUINÉEN
\:==~~~~
ÎLES DU PACIFIQUE
. ASIATIQUE DU SUD-EST
~ ASIATIQUE DU NORD-EST w
,...--, ASIATIQUE DU NORD-EST ARCTIQUE
.m
~!!!!!I!!!!!!!!!!!!!_
AMÉRINDIEN ~
EUROPÉEN
5
~:;::=;:=::t:=
CAUCASIEN NON-AFRICAIN ~
~::;;;;=:;;;;;;;::;:::;;::::;~=::;:;;;œ:::::':il:l1l!œ!lAFRICAIN §
1 1 1 1
-lU
0,15 0,10 0,05 0,00
fE
dépendent de l'époque à laquelle on
considère que l'homme moderne est
apparu. Cependant cette apparition est
incontestablement antérieure aux pre-
mières migrations de l'Asie vers le
continent américain, migrations qui
n'ont pu se produire que lorsque le
détroit de Béring s'est asséché et que le
climat s'est adouci. Quant à la colonisa-
tion de l'Australie et des îles du
Pacifique, elle doit être assez récente,
puisqu'elle n'eut lieu qu'après la décou-
verte de la migration maritime.
-~/
"-
\.
-
t
.:».
"-
,j
/"
",
.'
,/
~
génétiques plus récentes révèlent deux voies de migration de
l'Afrique vers l'Asie Uesflèches rouges) ; toutefois certains trajets res-
tent encore mal connus. On a indiqué, àcôté de ces voies de
migration, les dates des premières colonisations.
3. Au COURS DU TEMPS, les populations subissent une différenciation·
génétique, comme celle qui figure dans cet arbre généalogique d'une
famille ethnique (à gaucheJ. Cette dérive génétique est simulée sur
©POUR
LA
SCIENCE
TEMPS (EN ANNÉES)
500 1 000 1 500 2 000 2 500
ordinateur
droite). Lorsque les deux moitiés d'une population se
séparent, elles ont des fréquences géniques égales, mais le temps et le
hasard modifient parfois ces fréquences dans des sens opposés.
45
L'Australie semble avoir été coloni-
sée par des groupes venant d'Asie du
Sud-Est, il y a environ 40 000 à
60 000 ans. Le peuplement du continent
américain est plus difficile à dater : en
Alaska, le premier vestige connu de pré-
sence humaine remonte à près de
15000 ans, alors qu'en Amérique du Sud
l'occupation humaine semble plus
ancienne (entre 15 000 et 35 000 ans).
Les résultats de nos études génétiques
indiquent que la colonisation de
l'Amérique date d'il y a 30 000 ans
environ.
L'Europe, enfin, fut balayée par de
nombreuses vagues migratoires, mais
les vestiges des premières occupations
ont subsisté. En 1954, à Londres, Arthur
Mourant réalisa l'une des premières
études de la géographie des gènes en
proposant que les Basques étaient les
plus anciens habitants d'Europe, qui
auraient conservé une partie de leur
constitution génétique primitive malgré
leurs contacts avec les immigrants ulté-
rieurs. Cette hypothèse se fondait sur les
analyses du gène Rhésus négatif, qui est
beaucoup plus fréquent chez les
Basques que chez toute autre population
dans le monde. Cette théorie fut confir-
mée par des analyses d'autres gènes et
par des études linguistiques : la langue
basque diffère notablement des langues
des peuples voisins.
Une analyse récente des variations
génétiques en Europe a permis d'élabo-
rer un modèle de la colonisation de
l'Europe: les premiers agriculteurs du
Néolithique, venus du Moyen-Orient,
apportèrent en Europe leurs gènes, leur
culture et leurs langues indo-euro-
péennes par un lent processus d'expan-
sion (voir
La dispersion des langues
indo-européennes,
par Colin Renfrew,
dans ce dossier). Les ancêtres des
Basques, à l'extrémité de ce chemin
migratoire, se mélangèrent peu aux nou-
veaux immigrants.
TIfaut cependant noter que l'analyse
génétique des populations ne permet de
reconstituer que les migrations qui ont
eu un impact génétique décelable. Par
exemple, avant les Portugais et les
Espagnols, les Vikings ont probable-
ment établi de brèves colonies en
Amérique, mais leur contribution géné-
tique locale n'a pas pu être déterminée.
Ayant observé une étonnante corres-
pondance entre la répartition des gènes et
celle des langues, nous avons cherché
des cas où une langue ou une famille de
langues permettait d'identifier une popu-
lation génétique.
46
CORRESPONDANCES ENTRE LES PEUPLES ET LES LANGUES
RELATIONS GÉNÉTIQUES
__--------------------A~-------------------- __
,.---
DISTANCE GÉNÉTIQUE
0,030 0,024 0,018 0,012 0,006 0,000
©POUR LA SCIENCE
1 / 7 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !