Des gènes, des peuples et des langues

publicité
Des gènes, des peuples
et des langues
Luigi
l'arbre des apparentements entre les populations
humaines est analogue à celui des relations
entre les langues parlées dans le monde.
Tous deux indiquent une série de migrations
à partir d'un berceau probablement africain.
1Ya plus de 40 ans, lorsque j'étudiais la génétique des bactéries
dans le laboratoire de Ronald
Fisher, à l'Université de Cambridge, mes collègues étaient passionnés de modèles mathématiques. C'est
pourquoi j'imaginais alors un projet si
ambitieux qu'il paraissait presque fou:
la recherche du berceau des populations
humaines et la reconstitution des voies
de migration par lesquelles elles
s'étaient dispersées sur le Globe, à partir de la détermination du degré de
parenté des populations actuelles et de
l'établissement d'un arbre généalogique
complet.
Ce but est presque atteint. En analysant les données génétiques humaines
accumulées lors des 50 dernières
années, ainsi que d'autres résultats mettant en œuvre des techniques génétiques
récentes, mes collègues et moi-même
avons dressé la carte de la répartition
géographique de plusieurs centaines de
gènes, et nous en avons déduit les filia-
1
tions des populations humaines. Cet
arbre concorde avec un autre arbre établi sur la base de données génétiques
entièrement différentes, mais pour un
nombre plus restreint de populations,
ainsi qu'avec un arbre des familles de
langues récemment obtenu. Ainsi les
gènes, les populations et les langues
semblent avoir simultanément divergé
au cours de migrations qui, probablement à partir de l'Afrique, auraient
gagné l'Asie, puis l'Europe, le Nouveau
Monde et le Pacifique.
Pour déterminer l'histoire des populations humaines à partir de leur arbre
généalogique, on admet que la différence (ou distance) génétique entre deux
populations est d'autant plus grande que
leur séparation est plus ancienne (en
supposant que toutes les autres forces
évolutives sont égales par ailleurs).
Les hommes sont parfois classés en
groupes ethniques, ou «races» (bien que
ce dernier terme ait une connotation
détestable en insinuant l'existence
CAVALLI-SFORZA
d'une hiérarchie raciale), mais on
trouve difficilement une définition précise et utile de ces groupes ethniques,
car ces derniers évoluent et se chevauchent parfois. Heureusement la classification des langues nous aide à retrouver
leurs relations.
Durant la majeure partie de sa préhistoire et de son histoire, l'espèce
humaine était organisée en tribus, c'està-dire en groupes de personnes étroitement apparentées; ces affiliations tribales sont encore très importantes dans
les sociétés traditionnelles. Comme il
existe une correspondance étroite entre
affiliation tribale et affiliation linguistique, les langues permettent souvent
d'identifier les tribus ; ensuite l'affiliation tribale mène à une classification
approximative des populations.
La situation est plus complexe dans
les sociétés urbaines. Aussi, pour simplifier notre étude, nous ne nous
sommes intéressés qu'aux populations
indigènes, c'est-à-dire celles qui étaient
déjà présentes sur leur territoire actuel
avant les grandes migrations qui ont
suivi les explorations de la Renaissance. Les distances génétiques entre
les populations actuelles ne peuvent
être calculées sur la base de la seule
présence ou de l'absence de caractères
génétiques, car chaque population possède presque tout le répertoire des
gènes existants. Ce qui différencie les
populations, c'est la fréquence observée des divers gènes.
ASIATIQUE
CAUCASIEN
MÉDITERRANÉEN
42
EUROPÉEN
DU NORD
INDIEN
BUSHMEN
JU/HUA
MASAi
PYGMÉE
CHINOIS
TIBÉTAIN
© POUR LA SCIENCE
Le facteur
Rhésus
Ce phénomène apparaît nettement dans
le cas du facteur Rhésus (Rh), cet antigène des globules rouges du sang
humain qui existe sous deux formes
(positive ou négative). Ce caractère est
déterminé par un seul gène et, pour des
raisons de santé publique, il a été étudié
dans des milliers de populations : les
médecins doivent identifier les femmes
Rhésus négatif et dont le fœtus est
Rhésus positif, afin de leur administrer,
immédiatement après l'accouchement,
un traitement immunologique qui prévient la formation par l'organisme
maternel d'anticorps qui agiraient contre
les enfants qui seraient conçus ultérieurement. Le gène de l'antigène Rhésus
négatif est fréquent en Europe, plus rare
en Afrique et en Asie de l'Ouest, et
presque absent en Asie de l'Est et chez
les populations indigènes d'Amérique et
d'Australie (voir lafigure 1).
On estime l'apparentement
entre
deux groupes ethniques en soustrayant les
pourcentages d'individus Rhésus négatif
de ces deux groupes : par exemple, les
Anglais (16 pour cent d'individus Rhésus
négatif) diffèrent des Basques (25 pour
cent) de 9 pour cent, et des Asiatiques de
l'Est de 16 pour cent: dans le second cas,
la différence supérieure correspond probablement à une séparation antérieure.
En pratique, les généticiens effectuent des opérations un peu plus complexes que la soustraction afin d'obtenir
des distances génétiques qui reflètent au
mieux l'histoire évolutive des populations. Quand une même population est
scindée en plusieurs groupes qui sont
totalement isolés les uns des autres, par
exemple, ces groupes se différencient
génétiquement même en l'absence de
mutations et de sélection naturelle : seul
le hasard modifie leurs fréquences
géniques par un mécanisme de «dérive
génétique».
En l'absence de forces évolutives
particulières, la distance génétique entre
deux populations augmente régulière-
CORÉEN
ARCTIQUE
INUIT
© POUR LA SCIENCE
ment au cours du temps : elle est
d'autant plus grande que la divergence
entre ces populations est plus ancienne.
Les distances génétiques peuvent-elles
alors être une sorte d'horloge qui daterait les événements
de l'histoire
humaine? Difficilement, car des analyses statistiques montrent qu'un seul
gène (telle gène Rhésus) est insuffisant
pour fournir une chronologie précise.
Pour déterminer les distances génétiques, on doit calculer des moyennes
sur de nombreux gènes et, idéalement,
on devrait comparer les résultats obtenus à ceux qui proviendraient d'autres
ensembles de gènes. Fort heureusement,
on connaît des milliers de gènes, bien
que peu d'entre eux aient été étudiés
dans de nombreuses populations.
Les distances génétiques conduisent à
plusieurs types d'arbres généalogiques. TI
y a 27 ans, Anthony Edwards, de
Cambridge, et moi avons publié un arbre
qui reliait 15 populations en nous fondant
sur le principe du «chemin génétique
minimal». Comme l'indique le nom de ce
principe, dû à A. Edwards, l'arbre établi
est celui dont la longueur totale des
branches est minimale. Lorsqu'on le projette sur une carte du monde afin que ses
extrémités soient situées sur les habitats
actuels des populations, cet arbre correspond approximativement aux migrations
anciennes reconstituées par les anthropologues (voir la figure 2). On ignore malheureusement si le chemin génétique
minimal est la meilleure méthode pour
construire un arbre à partir des données
génétiques. D'autres méthodes pourraient
donner des longueurs de branches plus
proportionnelles au temps écoulé et procurer ainsi une meilleure estimation des
dates de séparation des divers groupes
(voir la figure 3). On peut définir la
racine de l'arbre reliant les populations à
un groupe extérieur, par exemple au
groupe des chimpanzés, dont l'espèce
humaine semble s'être séparée il y a cinq
à sept millions d'années. Si l'on admet
que la vitesse d'évolution est identique
sur les différentes branches, leur longueur
pourrait être proportionnelle au temps
écoulé depuis leur individualisation.
Cependant de tels arbres sont erronés si
toutes les branches n'ont pas évolué à la
même vitesse.
Les vitesses d'évolution
On minimise les erreurs en utilisant des
modèles mathématiques qui permettent
d'estimer avec précision les vitesses
d'évolution. Le modèle d'évolution que
nous avons utilisé est le plus simple: il
postule que deux branches évoluent à la
même vitesse quand la dérive génétique
est la principale force évolutive et
quand les populations ont la même taille
en moyenne. La première hypothèse a
été démontrée par plusieurs observations indépendantes, et la seconde est
rendue très probable lorsqu'on choisit
les populations de façon adéquate. Les
vitesses d'évolution ont des chances
d'être constantes pour les grandes populations vivant sur de vastes territoires
depuis leur installation originale.
Avec Paolo Menozzi, de Parme, et
Alberto Piazza, de Turin, j'ai établi une
méthode d'analyse commune de l'histoire et de la géographie des gènes
humains. Durant 12 ans, nous avons
analysé l'ensemble des données génétiques accumulées au cours des 50 dernières années sur plus de 100 caractères
génétiques différents, provenant d'environ 3 000 échantillons
issus de
1 800 populations ; la plupart de ces
échantillons comportaient des centaines
ou des milliers d'individus. Ces données (que nous nommerons l' «ensemble
classique») sont indirectement dérivées
des protéines, les produits des gènes.
Récemment nous avons comparé ces
données à un second ensemble : des
données moléculaires sur les séquences
nucléotidiques de l'ADN, c'est-à-dire les
gènes eux-mêmes (et non plus les caractères génétiques exprimés par les individus). La plupart de ces données moléculaires ont été collectées durant sept ans
par mes collègues de l'Université de
AMÉRICAIN
AZTÈQUE
YANOMANO
PACIFIQUE
POLYNÉSIEN
MAORI
MÉLANÉSIEN
AUSTRALIEN
43
des fréquences constantes au cours du
temps. La racine de l' «arbre mitochondrial» est plus facile à dater que celle de
l' «arbre nucléaire» : il suffit de comparer cet arbre à un groupe extérieur
- celui des chimpanzés, dans l'étude
d'A. Wilson - qui s'est séparé à une
date approximativement connue.
BASQUE
0-1
0
0
0
0
1-4
L'Ève Africaine
4-9
9-16
16-25
D
,
25+
POURCENTAGES
D'INDIVIDUS RHÉSUS NÉGATIF
1. CETTE CARTE MONTRE QUE LE FACTEUR RHÉSUS NÉGATIF est le plus fréquent dans la population basque et de moins en moins vers l'Ouest. Par conséquent. les Basques auraient
conservé les caractères d'une population européenne primitive, qui se serait ultérieurement
mélangée aux immigrants d'origine asiatique.
Stanford et par l'équipe de Kenneth et
de Judith Kidd, de l'Université Yale. À
bien des égards, la qualité des nouvelles
données est supérieure à celle de
l'ensemble classique, mais elles proviennent de 100 fois moins de populations.
Néanmoins, chaque fois que nous avons
pu les comparer, ces données moléculaires concordaient parfaitement avec les
données de l'ensemble classique.
Un berceau africain
Notre premier résultat confirme l'étude
des fossiles et des vestiges culturels
humains: l'Afrique fut le berceau de
l'espèce humaine. En effet, les distances
génétiques entre les Africains et les
non-Africains sont les plus grandes de
toutes, ce qui se comprend si la divergence africaine a été la première et la
plus ancienne.
La distance génétique entre les
Africains et les non-Africains est environ le double de la distance entre les
Australiens et les Asiatiques, qui est
elle-même plus de deux fois supérieure à
la distance entre les Européens et les
Asiatiques. Les paléo-anthropologues
ont déterminé des dates de séparation de
ces diverses populations qui sont proportionnelles aux distances génétiques : les
Asiatiques se sont séparés des Africains
il y a 100 000 ans, les Australiens des
Asiatiques il y a 50 000 ans, et les
Européens des Asiatiques il y a entre
35 000 et 40 000 ans. Dans ces
exemples, les distances génétiques sont
des horloges biologiques admissibles.
44
Allan Wilson et ses collègues de
l'Université de Berkeley ont daté l'arbre
humain à partir de données génétiques
différentes des nôtres, et leurs principaux
résultats, publiés vers la fin de notre première étude, ont globalement confirmé
nos résultats. L'équipe de Berkeley a étudié les quelques gènes qui sont codés par
l'ADN mitochondrial (les mitochondries
sont les organites cellulaires qui produisent l'énergie cellulaire). À Stanford,
nous avions aussi commencé à étudier les
gènes mitochondriaux,
mais nos
méthodes étaient bien moins précises.
L'hérédité mitochondriale est très
particulière. D'une part, alors que chaque
individu reçoit autant de gènes nucléaires
de son père que de sa mère, les gènes
mitochondriaux sont transmis presque
exclusivement par la mère : cette transmission quasi unilatérale simplifie considérablement le calcul des distances génétiques. D'autre part, les mutations des
gènes mitochondriaux sont beaucoup
plus fréquentes que les mutations des
gènes nucléaires, de sorte que l'on peut
calculer les distances génétiques à partir
du nombre de mutations et non plus à
partir des fréquences des gènes.
L'utilisation d'une horloge mitochondriale, correspondant au nombre de
mutations qui se sont accumulées dans
les gènes mitochondriaux et non aux
variations des fréquences géniques,
impose le recours à des hypothèses différentes de celles que nous avons considérées. Notamment l'équipe d'A. Wilson a supposé que les mutations des
gènes mitochondriaux se produisent à
L'arbre mitonchondrial établi à Berkeley
présente une plus grande différenciation
en Afrique que partout ailleurs : par
conséquent, ce serait en Afrique que
l'ADNmitochondrial humain aurait évolué
le plus longtemps. On a même fait
remonter cet ADNmitochontridal à une
seule femme, l' «Ève» africaine, mais
nous verrons plus loin que ce terme est
inapproprié. En comparant l'ADN mitochondrial humain à celui des chimpanzés,
les généticiens ont daté la racine de cet
arbre, puis estimé la date de divergence
des divers embranchements; en outre, ils
ont estimé que l'ancêtre africaine avait
vécu il y a 150 000 à 200 000 ans, ce qui
confirmait nos résultats, obtenus par une
approche très différente. Récemment
cette datation a été révisée, mais elle reste
antérieure à la date que nous avons estimée pour la divergence des populations
africaine et asiatique, il y a 100 000 ans
environ. TI est d'ailleurs logique qu'elle
soit plus ancienne, car les deux dates sont
celles d'événements différents: l'un est
la naissance d'une femme, et l'autre la
scission d'une population à laquelle
appartenait cette femme.
Cependant une équivoque est née de
l'emploi du nom d' «Ève» pour désigner
l'ancêtre d'où nous tirons notre ADN
mitochondrial: rien ne prouve qu'il y ait
jamais eu une époque où une seule
femme vivait sur la Terre; de nombreuses autres femmes vivaient probablement à la même époque, mais leurs
gènes mitochondriaux auraient disparu.
Certaines des conclusions examinées
précédemment sont controversées. Si les
paléo-anthropologues s'accordent sur
l'origine africaine du genre Homo, il y a
2,5 millions d'années, et si les fossiles
découverts
montrent que l' Homo
sapiens, d'anatomie semblable à la nôtre,
est apparu en Afrique ou à proximité de
celle-ci il y a 100 000 ans environ, tous
les spécialistes ne sont pas d'accord avec
la théorie d'un exode à partir de
l'Afrique ; certains avancent notamment
que l'homme moderne est apparu bien
plus tôt et simultanément dans plusieurs
populations de l'Ancien Monde.
© POUR LA SCIENCE
Les migrations humaines
Les études de génétique des populations
donnent de précieuses informations sur
l'histoire des migrations successives et
sur l'origine des populations actuelles.
La confrontation de nos résultats avec
ceux des linguistes et des archéologues
semble prometteuse.
En général, les migrations résultent
des changements de l'environnement qui
sont soit des contraintes, soit des opportunités. À plusieurs reprises, les populations
d'hominidés, puis d'êtres humains se sont
développées - probablement après des
progrès culturels - et ont alors colonisé
de nouveaux territoires. Les vestiges
archéologiques (des ossements et des
outils de pierre, essentiellement) semblent confirmer que le berceau des hominidés était l'Afrique; de là, les hominidés
auraient migré, probablement il y a un
million d'années, vers l'Asie, via l'isthme
de Suez, puis de l'Asie vers l'Europe.
La reconstitution de l'étape suivante
est plus difficile parce que les résultats
dépendent de l'époque à laquelle on
considère que l'homme moderne est
apparu. Cependant cette apparition est
incontestablement antérieure aux premières migrations de l'Asie vers le
continent américain, migrations qui
n'ont pu se produire que lorsque le
détroit de Béring s'est asséché et que le
climat s'est adouci. Quant à la colonisation de l'Australie
et des îles du
Pacifique, elle doit être assez récente,
puisqu'elle n'eut lieu qu'après la découverte de la migration maritime.
L
-~/
:.
j
"-
-
\.
.:».
t
"-
,j
LES NOMBRES INDIQUENT LES DATES
ESTIMÉES DES PREMIÈRES COLONISATIONS
~
2. LES GÈNES ET LES PIERRES racontent la même histoire. Le premier
arbre génétique établi (en rouge) a été projeté sur une carte du
monde, de sorte que ses extrémités soient situées sur les habitats
actuels des populations indigènes (les points violets). Des études
~!!!!!!!!!!!!!!!!!!!!!I!!!!!!!!!!!!o
\:==~~~~
.
AUSTRALIEN
500
~
ASIATIQUE
DU NORD-EST
ASIATIQUE
DU NORD-EST ARCTIQUE
~!!!!!I!!!!!!!!!!!!!_
AMÉRINDIEN
1
0,05
CAUCASIEN
1
0,00
3. Au COURS DU TEMPS, les populations subissent une différenciation·
génétique, comme celle qui figure dans cet arbre généalogique d'une
famille ethnique (à gaucheJ. Cette dérive génétique est simulée sur
© POUR LA SCIENCE
1 000
1 500 2 000 2 500
ÎLES DU PACIFIQUE
ASIATIQUE DU SUD-EST
~::;;;;=:;;;;;;;::;:::;;::::;~=::;:;;;œ:::::':il:l1l!œ!l AFRICAIN
1
0,10
TEMPS (EN ANNÉES)
ET NÉO-GUINÉEN
,...--,
~:;::=;:=::t:=
.'",
génétiques plus récentes révèlent deux voies de migration
de
l'Afrique vers l'Asie Ues flèches rouges) ; toutefois certains trajets restent encore mal connus. On a indiqué, à côté de ces voies de
migration, les dates des premières colonisations.
.mw
~
5
EUROPÉEN
1
0,15
,/
/"
NON-AFRICAIN
~
§
-lU
fE
ordinateur (à droite). Lorsque les deux moitiés d'une population se
séparent, elles ont des fréquences géniques égales, mais le temps et le
hasard modifient parfois ces fréquences dans des sens opposés.
45
L'Australie semble avoir été colonisée par des groupes venant d'Asie du
Sud-Est, il y a environ 40 000 à
60 000 ans. Le peuplement du continent
américain est plus difficile à dater : en
Alaska, le premier vestige connu de présence humaine remonte à près de
15000 ans, alors qu'en Amérique du Sud
l'occupation
humaine semble plus
ancienne (entre 15 000 et 35 000 ans).
Les résultats de nos études génétiques
indiquent
que la colonisation
de
l'Amérique date d'il y a 30 000 ans
environ.
L'Europe, enfin, fut balayée par de
nombreuses vagues migratoires, mais
les vestiges des premières occupations
ont subsisté. En 1954, à Londres, Arthur
Mourant réalisa l'une des premières
études de la géographie des gènes en
proposant que les Basques étaient les
plus anciens habitants d'Europe, qui
auraient conservé une partie de leur
constitution génétique primitive malgré
leurs contacts avec les immigrants ultérieurs. Cette hypothèse se fondait sur les
analyses du gène Rhésus négatif, qui est
beaucoup plus fréquent chez les
Basques que chez toute autre population
dans le monde. Cette théorie fut confirmée par des analyses d'autres gènes et
par des études linguistiques : la langue
basque diffère notablement des langues
des peuples voisins.
Une analyse récente des variations
génétiques en Europe a permis d'élaborer un modèle de la colonisation de
l'Europe: les premiers agriculteurs du
Néolithique, venus du Moyen-Orient,
apportèrent en Europe leurs gènes, leur
culture et leurs langues indo-européennes par un lent processus d'expansion (voir La dispersion des langues
indo-européennes, par Colin Renfrew,
dans ce dossier). Les ancêtres des
Basques, à l'extrémité de ce chemin
migratoire, se mélangèrent peu aux nouveaux immigrants.
TIfaut cependant noter que l'analyse
génétique des populations ne permet de
reconstituer que les migrations qui ont
eu un impact génétique décelable. Par
exemple, avant les Portugais et les
Espagnols, les Vikings ont probablement établi de brèves colonies en
Amérique, mais leur contribution génétique locale n'a pas pu être déterminée.
Ayant observé une étonnante correspondance entre la répartition des gènes et
celle des langues, nous avons cherché
des cas où une langue ou une famille de
langues permettait d'identifier une population génétique.
46
CORRESPONDANCES
ENTRE LES PEUPLES ET LES LANGUES
RELATIONS
GÉNÉTIQUES
,.---__--------------------A~--------------------
DISTANCE
0,030
__
GÉNÉTIQUE
0,024
0,018
0,012
0,006
© POUR LA SCIENCE
0,000
La concordance des arbres
génétique et linguistique
POPULATIONS
r-
-.....,
--
PYGMÉE
MBUTI
•
m;;r
(ORIGINE
••••
INCONNUE)
OUEST-AFRICAIN
NIGER-KORDOFADIEN
BANTOU
NILOTIQUE
""'"
LINGUISTIQUE
BUSHMEN
NILO-SAHARIEN
(SAN)
KHOisAN
BERBÈRE,
N. AFRICAIN
AFRO-ASIAT IQUE
ASIATIQUE
DU S.-O.
ÉTHIOPIEN
"-
~
IRANIEN
~
EUROPÉEN
INDO-EURO PÉEN
SARDIEN
INDIEN
INDIEN DU S.-E.
DRAVIDIEN
CIl
)-
LAPON
C
"U
m
OURALIQUE
:Il
SAMOYÈDE
ZCIl
OC
CIl"U
MONGOLE
-lm
:Il:Il
TIBÉTAIN
~~H~ ~
SINO-TIBÉT AIN
O~
Cr
CORÉEN
mm
JAPONAIS
ALTAïQUE
SIBÉRIEN
ESKIMO
ESKIMO-AL ÉOUTE
TCHOUKTCHE
TCHOUKTC HI-KAMTCHADAL
AMÉRINDIEN
DU S.
AMÉRINDIEN
CENTRE
AMÉRINDIEN
DU N.
AMÉRINDIEN
DU N.-O.
AMÉRINDIEN
SI NO-TIBÉTAIN
:
··
·
KHMER
THAï
DAïAK
ê
g)
"U
•••
--------i1l
MALAYSIEN
••
AUSTRONÉSIEN
PHILIPPiN
I2
~
>-~
INDONÉSIEN
__
~~~."",d'
~
:t>
1
C
1 ~
5
C
Ir
POLYNÉSIEN
~
MICRONÉSIEN
MÉLANÉSIEN
NÉO-GUINÉEN
AUSTRALIEN
~
),0
© POUR LA SCIENCE
m
-_ •.>-
INDO-PACIFIQUE
AUSTRALIEN
r
m
m
C
:Il
:t>
CIl
m
NA-DÉNÉ
AUSTRO-ASIATIQUE
=
o
C
·
......•.•....•••·
CHINOIS DU SUD
s:
~
··
··
··
AiNOU
I2
Les quelque 400 langues de la famille
bantoue, au centre et au Sud de l'Afrique, correspondent étroitement aux frontières tribales et aux affiliations génétiques de ces tribus. Joseph Greenberg, à
l'Université Stanford, a proposé une
explication de cette correspondance dans
les années 1950, et il a convaincu la plupart des spécialistes. Les langues bantoues dériveraient d'une seule langue ou
d'un petit nombre de dialectes très
proches, parlés par les premiers agriculteurs de l'Est du Nigeria et du Cameroun. Quand ces agriculteurs ont ensuite
migré vers l'Afrique centrale et vers le
Sud de l'Afrique, il y a 3 000 ans ou
plus, leurs langues ont divergé sans toutefois oblitérer leur origine commune
(voir Les migrations des populations
bantoues, par D. Phillipson, dans ce dossier). Comme cette explication vaut
aussi pour leurs gènes, le mot bantou
- qui désignait initialement une famille
linguistique - est aujourd'hui également
appliqué au groupe génétique.
En 1988, nous avons publié un arbre
représentant l'apparentement génétique
et linguistique de 42 populations du
Globe : la correspondance entre les
groupements génétiques de ces populations et les groupements linguistiques est
flagrante. À de rares exceptions près, les
familles linguistiques semblent d'origine
récente dans notre arbre génétique. En
outre, deux équipes de linguistes ont
récemment regroupé les familles de
langues en «superfamilles» qui s'accordent avec nos résultats génétiques. Ainsi
se trouve vérifiée une conjecture proposée par Darwin, en 1859, dans son
fameux ouvrage De l'origine des
espèces au moyen de la sélection naturelle (chapitre 14) : on peut prévoir
l'évolution linguistique des populations
à partir de leur arbre génétique.
Pourquoi les évolutions linguistique
et génétique sont-elles si parallèles? La
réponse est dans l'histoire des populations et non dans la génétique, car si les
gènes ne déterminent pas le langage, les
circonstances qui entourent la naissance
des individus déterminent la langue
qu'ils apprendront. Inversement les différences linguistiques peuvent parfois
créer ou renforcer des barrières génétiques entre les populations,
bien
qu'elles ne soient pas la cause première
du parallélisme. L'histoire humaine est
ponctuée par des scissions de populations en sous-groupes, qui s'installent
47
parfois loin de leur lieu d'origine; les
gènes et les langues de chaque sousgroupe évoluent tout en conservant la
trace de leur origine commune, de sorte
que la correspondance entre les gènes et
les langues est inévitable.
Les séparations complètes lorsque,
par exemple, un sous-groupe migre vers
un nouveau continent, sont rares, mais
des montagnes ou des océans ne sont
pas indispensables pour isoler deux
populations : l'étude génétique de nombreuses espèces animales ou végétales
montre que la distance suffit. Puisque
les échanges entre deux populations
sont d'autant plus importants que ces
populations sont géographiquement
proches, la distance génétique entre
deux populations devrait augmenter
avec la distance géographique. TIen va
de même pour les langues. Lorsqu'aucune
barrière ne bloque les
échanges, les variations génétiques et
linguistiques sont continues ; inversement, la présence d'un obstacle à la
migration provoque une discontinuité
dans les variations génétiques et linguistiques.
Les substitutions
de langues et de gènes
La correspondance entre les langues et
les gènes souffre de deux exceptions : la
substitution de langues et la substitution
de gènes. La première résulte de l'abandon d'une langue ancestrale au profit
d'une nouvelle langue - celle d'immigrants, de conquérants ou d'une nouvelle élite culturelle ; une telle substitution linguistique est d'autant plus rare
que la nouvelle langue diffère davantage
de la langue originelle. Le basque est un
cas extrême de langue ayant survécu
durant des milliers d'années, alors que
les langues des populations voisines ont
constamment évolué. La substitution des
gènes, généralement partielle, se produit
lorsque deux populations se mélangent.
Quand ce mélange est progressif, il
modifie dans la même proportion la fréquence relative de tous les gènes. Alors
que la substitution génique est graduelle,
la substitution linguistique obéit généralement à la loi du tout ou rien. En effet,
une langue conserve son intégrité ancestrale même lorsqu'elle emprunte beaucoup de mots à une autre famille ou à
une autre sous-famille linguistique. Les
linguistes admettent, par exemple, que
l'anglais dérive d'une sous-famille germanique malgré ses emprunts au français, au grec et au latin. Ce sont les
48
structures -syntaxiques et le vocabulaire
de base qui définissent la langue.
La différence entre la substitution
génique et la substitution linguistique a
une conséquence importante : une minorité conquérante imposera à une majorité
conquise une nouvelle langue, qui se
substituera
presque entièrement
à
l'ancienne, mais les nouveaux gènes ne
se substitueront aux anciens qu'en proportion des populations de conquérants
et de conquis : ainsi les Hongrois parlent
une langue originaire de l'Oural, qui leur
fut imposée par les conquérants magyars
au Moyen Âge, mais la plupart de leurs
gènes sont d'origine européenne, et la
population actuelle ne présente que des
traces infimes de gènes magyars.
Les substitutions complètes de gènes
sont rares, mais nous en avons découvert
au moins un exemple dans nos arbres
génétique et linguistique : les Lapons,
qui vivent au Nord de la Scandinavie,
parlent aussi une langue ouralique, mais
leurs gènes semblent résulter d'un brassage entre des populations mongoles de
Sibérie et des populations scandinaves,
dont la contribution est majoritaire. Ce
brassage transparaît dans la chevelure et
dans la couleur de peau des Lapons, qui
passent par toutes les nuances claires et
foncées. De même, les Éthiopiens résulteraient d'un mélange génétique entre
des populations africaines, qui prédominent, et des populations caucasoïdes
d'Arabie. Même limité, un apport de
gènes produit un effet important s'il se
poursuit suffisamment longtemps. Par
exemple, les Américains d'origine africaine possèdent aujourd'hui 30 pour
cent de gènes d'origine européenne;
cette proportion aurait été obtenue si
cinq pour cent environ des Noirs américains s'étaient unis avec un Américain
d'origine européenne, à chaque génération depuis l'introduction de l'esclavage
en Amérique et en considérant tous les
métis comme noirs. Si ce métissage se
poursuit au même rythme durant un millier d'années, il ne restera pas grandchose de la composante génétique africaine originelle en Amérique.
En définitive, il est même surprenant
que la correspondance entre les gènes et
les langues subsiste en dépit des substitutions génétique et linguistique. Cette
conservation est partiellement due au fait
que notre étude ne porte que sur des
populations indigènes, mais des études
récentes confirment l'existence de la correspondance à une échelle microgéographique. Par exemple, notre arbre génétique des premiers Américains concorde
avec la classification des langues du
Nouveau Monde établie récemment par
J. Greenberg, qui distingue trois grandes
familles linguistiques : ces deux études,
menées indépendamment à partir de données différentes, montrent que la colonisation du continent américain résulte
d'un petit nombre de migrations distinctes et successives.
En fait, les gènes et la culture sont
probablement liés pour une autre raison :
dans les sociétés traditionnelles que nous
avons étudiées, la transmission de la culture reste essentiellement verticale (des
parents aux enfants). Alors que les gènes
se transmettent toujours verticalement,
la culture est transmise à la fois verticalement, de génération en génération, et
horizontalement, entre personnes non
apparentées. Par exemple, à chaque saison, la haute couture parisienne est diffusée dans le monde entier (bien que la
mode italienne commence aussi à
s'imposer). Aujourd'hui la transmission
horizontale prend une importance croissante, alors que, dans les sociétés traditionnelles, la transmission est essentiellement verticale, ce qui rend ces sociétés
plus conservatrices.
Les substitutions génétique et linguistique, avec leurs lois particulières,
sont davantage que des exceptions à
notre modèle : elles peuvent fournir de
précieuses informations sur l'évolution
des populations et des langues et sur le
développement de la culture humaine.
Leur étude compléterait utilement notre
travail, et les anthropologues auraient
intérêt à se mettre à l'ouvrage avant que
les populations indigènes ne perdent
leur identité. D'autre part, les biologistes, devraient profiter du Projet
d'étude du génome humain pour recenser la diversité génétique humaine avant
qu'elle ne disparaisse.
Luigi Luca CAVALLI-SFORZA enseigne
génétique à l'Université Stanford.
la
L.L. CAVALLI-SFORZA, Qui sommes-nous,
Rammarion, 1997.
AM. BOWCOCK et al., Drift, Admixture and
Selection in Human Evolution: A Study with
dna Polymophisms, in Proceedings of the
National Academy of Sciences, vol. 88, n° 3,
pp. 839-843, 1er février 1991.
LL CAVAW-SFORZAet al., Reconstruction of
Human
Evolution
: Bringing
together
Genetk; Archaeological and Unguistic Data,
in Proceedings of the National Academy of
Sciences, vol. 85, n° 16, pp. 6 002-6 006,
août 1988.
© POUR LA SCIENCE
Téléchargement