2.2 Dendrogrammes - Manuel de l`évolution biologique

publicité
2.2 ­ Les dendrogrammes
Le dendrogramme est une figure arborescente. Si, dans sa construction, l'on introduit l'hypothèse que les ressemblances sont le reflet d'une relation de parenté, le dendrogramme est généalogique ; si l'on introduit celle que les ressemblances évoluent au cours du temps, le dendrogramme est phylogénétique. Les dendrogrammes retenus dans cette section mettent en évidence des ressemblances entre différents taxons.
L'objectif de recherche est souvent double ; dans un premier temps, il s'agit de mettre en évidence sur un schéma synthétique (le dendrogramme) les relations généalogiques ou évolutives entre plusieurs taxons ; dans un second temps, d'apprécier leur degré de divergence. Ce dernier est estimé en fonction soit du temps qui sépare les taxons, soit des différences génétiques, moléculaires ou autres accumulées entre ces mêmes taxons.
Les constructions phylogénétiques sont bâties principalement à partir de l'anatomie comparée, l'ontogénie et la paléontologie.
L'anatomie comparée a pour objectif de rechercher les homologies en utilisant, par exemple, le principe de subordination des caractères de B. de JUSSIEU ( les caractères constants sont plus importants que les caractères inconstants), ou encore celui des connexions de É. GEOFFROY SAINT­HILAIRE (voir la section précédente) : quelles que soient leur forme, leur taille ou leur fonction, des organes sont reconnus homologues s'ils possèdent les mêmes connexions avec d'autres organes.
L'ontogénie utilise le principe de récapitulation (loi biogénétique fondamentale) de E. HAECKEL, mais reformulé par Gareth NELSON (1973) : lorsque l'on peut suivre la transformation d'un caractère d'un état général vers un état plus spécialisé, le caractère le plus général est le plus ancien, le moins général est le plus récent, dérivé du premier. La règle de G. NELSON, qui n'est pas sans rappeler les deux premières règles de K. E. von BAER, est une hypothèse de travail et non une loi.
La paléontologie fournit des arguments morphologiques, mais aussi des arguments chronologiques.
À ces données traditionnelles s'ajoutent aujourd'hui celles de la biologie moléculaire : séquençages des protéines, de l'ADN, de l'ARN, hybridation de l'ADN.
L'unité de base de la construction phylogénétique est très souvent l'espèce, puisqu'elle est un groupe génétique fermé : l'interfertilité existe uniquement entre ses 103
membres. Mais certains auteurs rejettent cet usage de l'espèce, car leurs travaux concernent des populations plus que des espèces entières : sous­espèces et espèces sont alors confondues. Pour éviter l'emploi du mot « espèce », les taxons sont qualifiés d'unités évolutives (UE), d'unités évolutives hypothétiques (UEH) s’ils sont de pures constructions fictives, ou encore d’unités taxinomiques opérationnelles (UTO ou OTU dans la terminologie anglo­saxonne). Les taxons sont parfois de niveau supraspécifique ; dans ce cas, ils doivent appartenir à une même lignée phylétique (lignée monophylétique) pour demeurer comparables.
Les arbres sont composés de deux régions : les noeuds où sont placés les taxons qui sont souvent des UEH, car on ne connaît pas les formes fossiles, et les branches qui indiquent le degré de parenté des différents taxons. La longueur des branches est proportionnelle au temps ou bien aux différences entre taxons (fig. 2.15). À leurs extrémités figurent les taxons terminaux qui sont des UE.
Fig. 2.15
Si l'arbre est enraciné (fig. 2.15­A), la racine représente l'ancêtre commun et il précise alors les relations évolutives des différents taxons présents. Mais l'arbre est souvent dépourvu de racines (fig. 2.15­B) : il rend compte uniquement des relations de parenté, sans que l'on puisse savoir comment l'évolution passe d'un taxon à l'autre. Cependant un arbre peut être enraciné si on le construit avec un taxon extérieur au groupe, UE extra­groupe, qui sera la référence pour estimer les degrés de ressemblance entre les taxons étudiés. Il est nécessaire de connaître précisément les données taxinomiques 104
ou paléontologiques de cette UE extra­groupe ; il faut, en effet, être sûr qu'elle a divergé bien avant l'ancêtre commun aux UE considérées (fig. 2.15­A). Lorsque l'on dispose d'un certain nombre d'UE dont on veut établir la parenté, le nombre théorique d'arbres possibles augmente très rapidement :
­ avec n unités (UE) et si l'arbre est enraciné, il y a N1 arbres théoriques, soit : N1 = (2n ­ 3) ! : 2 n­2 (n ­ 2) !
­ avec n unités (UE) et si l'arbre n'est pas enraciné, il y a N2 arbres possibles, soit :
N2 = (2n ­ 5) ! : 2 n­2 (n ­ 2) !
Si n = 10, N1 est égal à 35.106 et N2 à 2.106 ; la formule exprime les incertitudes pour déterminer l'arbre exact parmi plusieurs millions. Un exemple sera donné à propos de l'émergence de l'Homme moderne à la section 4.4.3 : « Le modèle unirégional ou monocentrique, discussion ».
Les classifications phylogénétiques utilisent abondamment le critère d'homologie. Les ressemblances sans lien de parenté sont des homoplasies parmi lesquelles on distingue les convergences (ressemblances adaptatives) et les réversions, brusque apparition d'un caractère rappelant un caractère ancestral. Un caractère ancestral est plésiomorphe ; un caractère dérivé est apomorphe.
Parmi les quatre méthodes principales ­ phénétique, cladistique, probabiliste et de compatibilité ­, seules seront évoquées les deux premières, car ce sont les plus fréquentes.
2.2.1 ­ La méthode phénétique ou numérique
Conçue par Charles MICHENER et Robert SOKAL (1957), elle utilise un nombre réduit de principes. La construction des arbres phénétiques (phénogrammes) repose sur les ressemblances observées entre chaque paire d'UE (unité évolutive). Les ressemblances englobent ici aussi bien les homologies que les homoplasies, les plésiomorphies (caractères ancestraux) que les apomorphies (caractères dérivés). Les phénéticiens admettent que les caractères évoluent indépendamment les uns des autres et qu'ils ont tous le même poids. Plus le nombre de caractères étudiés est élevé, meilleure sera la classification. Les ressemblances entre UE sont souvent estimées par l'emploi d'une matrice de similitude (voir ci­dessous la méthode UPGMA). Peter SNEATH et R. SOKAL précisent que les phénogrammes ne sont pas a priori phylogénétiques ; en fait, ces arbres doivent être reconnus seulement comme 105
phénétiques. Le phénogramme n’a pas de racines, car il montre les relations morphologiques qui rapprochent ou qui éloignent plusieurs unités taxinomiques. Mais la notion d'évolution (phylogénie) peut se déduire des phénogrammes à condition d'introduire dans la construction des hypothèses évolutives telle que l'horloge moléculaire, par exemple.
On distingue trois méthodes phénétiques majeures :
­ La méthode d'ajustement. L'arbre non enraciné choisi est celui dont les longueurs des branches expliquent le mieux les ressemblances des UE ; l'introduction de certains critères permet de déterminer les longueurs.
­ La méthode de parcimonie. L’objectif, qui rappelle celui de la méthode cladistique, est d’obtenir un arbre non enraciné le plus court possible avec une minimisation des homoplasies.
­ Les méthodes d'agglomération. La classification est hiérarchique car les UE sont classées en fonction de leurs ressemblances. La méthode agglomérative dite UPGMA, abréviation anglaise de Unweighted Pair Group Method with Arlthmetic Mean, a été très employée par les phénéticiens pour traiter les données moléculaires (séquençage, etc.). Si la notion de l'horloge moléculaire est admise ; elle implique que le taux de mutations et la vitesse d'évolution d'un caractère donné sont constants. Par conséquent, les longueurs des branches de l'arbre peuvent être proportionnelles au temps. En revanche, la méthode dite « du plus proche voisin » (neighbor joining), qui se développe rapidement, n'utilise pas le postulat de l'horloge moléculaire. Les paires d'UE sont regroupées d'après leurs ressemblances, de telle sorte que l'arbre non enraciné construit soit le plus court possible.
Les résultats qui proviennent de l'étude de séquençage sont exprimés sous forme de chiffres qu’on soumet à un certain nombre de manipulations : ce tableau devient alors une matrice. La manière la plus simple consiste à quantifier les différences entre chaînes peptidiques (protéines) et nucléotidiques (ADN ou ARN). Tout calcul doit être précédé de l'alignement des séquences, même lorsque les chaînes sont de longueur identique. La figure 2.16 donne un exemple de matrice simple où sont reportés les nombres d'acides aminés différents de la chaîne α de l'hémoglobine, chez quelques Vertébrés ; les séquences sont comparées deux à deux.
106
Le nombre de différences correspond à une distance génétique : deux espèces seront d'autant plus proches que leurs différences seront faibles.
La figure 2.17 montre un exemple simple de calculs permettant la construction d'un phénogramme avec les transformations successives subies par la matrice.
107
Toutes les unités taxinomiques (espèces, familles, classes...) qui doivent être comparées sont des Unités Taxinomiques Opérationnelles (UTO) ou Operational Taxinomic Units (OTU). Au cours de l'établissement du phénogramme, on regroupe les deux espèces qui présentent la différence la plus petite, ici Homme­Chimpanzé, en une seule OTU : l'Homme et le Chimpanzé ont la différence la plus faible (1,45) des quatre (1,45­1,57­3,04 et 7,1).
La 2ème matrice se réalise comme il est indiqué sur la figure 2.17. Par exemple, la différence entre le Rhésus et l'OTU (Homme­Chimpanzé) est égale à la somme des 108
différences Homme­Macaque rhésus : 7,51 et Chimpanzé­Macaque rhésus : 7,5, divisée par 2 puisque Homme­Chimpanzé constitue un groupe. Pour le Gorille et l'Orang­outan, le raisonnement est identique. Dans cette 2ème matrice, la différence la plus faible concerne l'OTU (Homme­Chimpanzé) et le Gorille ; on regroupe donc en une 2ème OTU ces trois animaux.
La 3ème matrice est établie selon les mêmes règles. La différence entre l'OTU (Homme­Chimpanzé­Gorille) et l'Orang­outan est égale à la somme des différences Homme­Orang­outan 2,98, Chimpanzé­Orang­outan 2,94 et Gorille­Orang­outan 3,04, divisée par trois. La différence est la plus faible entre la 2 ème OTU (Homme­
Chimpanzé­Gorille) et l'Orang­outan ; ces quatre animaux constituent une 3ème OTU à l'origine de la dernière matrice.
Tous les calculs s'effectuent avec les résultats de la première matrice, et non avec les moyennes calculées par la suite.
Le phénogramme est bâti à partir des résultats suivants :
­ La différence Homme­Chimpanzé est de 1,45 ; on construit deux branches parallèles de longueur égale 1,45/2 = 0,725.
­ La différence (Homme­Chimpanzé)­Gorille est de 1,54 : la branche du Gorille mesure 1,54/2 = 0,77. L'OTU (Homme­Chimpanzé) comprend déjà deux branches de 0,725 ; pour obtenir un segment horizontal de longueur égale à 0,77, on rajoute un court segment de 0,045, soit (0,77 ­ 0,725), à ce groupe.
­ La différence (Homme­Chimpanzé­Gorille)­Orang­outan est de 1,495. La branche Orang­outan est donc de 1,495 et la 2ème branche, de 0,77, doit être rallongée de 0,725 soit (1,495 ­ 0,77).
­ La différence (Homme­Chimpanzé­Gorille­Orang­outan)­Macaque rhésus est de 3,695. Les deux dernières branches s'établissent comme ci­dessus.
La figure 2.18 donne un autre exemple un peu plus compliqué, non commenté ; au lecteur de s'exercer à reconstituer les OTU, les matrices et le phénogramme.
109
110
Les phénogrammes d’espèces identiques diffèrent parfois pour trois raisons : soit les caractères choisis comme critères varient d’une classification à l’autre, soit les indices de distance sont différents, soit les opérations matricielles ne sont pas identiques.
2.2.2 ­ L'horloge moléculaire
Ce concept se révèle très précieux pour traiter les données moléculaires, mais sa fiabilité est loin d'être démontrée. Les conclusions issues de son utilisation sont vivement controversées, comme on le verra dans la section 4.4.3, à propos de l'émergence de l'Homme moderne : « Le modèle unirégional ou monocentrique, discussion ».
Sa découverte Entre 1962 et 1965, Émile ZUCKERKANDL et Linus PAULING, ainsi que Emmanuel MARGOLIASH en 1963, ont travaillé respectivement sur les séquences polypeptidiques de l'hémoglobine et du cytochrome C, molécule intervenant dans le transfert d'électrons au cours de la chaîne respiratoire des mitochondries. Ils ont remarqué que le rythme de substitution des acides aminés de ces deux molécules demeurait constant chez différents Mammifères. La représentation graphique des ressemblances des molécules homologues de plusieurs espèces de Mammifères correspond à un dendrogramme très semblable à celui obtenu par les méthodes de la paléontologie ; de plus, la longueur des branches du premier est proportionnelle à celle du second. Il devient donc possible d’utiliser les degrés de ressemblance entre molécules homologues d’espèces plus ou moins apparentées pour dater des événements tels que la séparation de deux lignées, l’âge d’une lignée... Cette découverte étendue à tous les groupes est à l'origine du postulat de l'horloge moléculaire : chaque molécule possède un rythme de mutations qui lui est propre ; dénombrer les mutations qui ont affecté une molécule revient donc à dater son ancienneté.
La nature du matériel concerné
Les gènes sont les premières molécules affectées par cette horloge qui régule le rythme de leurs mutations. Mais les résultats se rapportent aux gènes de structure pour lesquels les biologistes disposent d'une quantité importante de données aussi bien qualitatives, connaissance du gène et de son fonctionnement, que quantitatives, connaissance du nombre de gènes. Les données qui se rapportent aux gènes de régulation, beaucoup plus limitées, ne concernent souvent que l'aspect qualitatif ; on 111
ignore encore la fréquence de leurs mutations. En général, l'horloge moléculaire règle donc le rythme des mutations de l'ADN nucléaire, mais aussi celui de l'ADN mitochondrial. Le taux de mutations peut être retrouvé indirectement par l'analyse des séquences protéiniques, par l'hybridation de l'ADN ou par le calcul des distances immunologiques.
L'utilité des calculs
L'horloge constitue un outil pratique et heuristique. Chaque gène, chaque protéine en possède une originale. Si, pour une molécule, le rythme des mutations est constant, on peut alors calculer l'âge de la divergence de deux lignées. L'horloge donne une probabilité de mutation. Le calcul de son rythme est effectué par estimation du nombre de mutations intervenues entre deux événements connus précisément dans une série fossile ou bien par le recensement des mutations présentes chez deux lignées dérivant d'un ancêtre commun ; il permet de tester la validité de la méthode. Aujourd'hui, la connaissance de nombreuses séquences d'ADN facilite la mesure du rythme de l'horloge, mieux certainement que ne pourraient le faire d'autres méthodes, comme le séquençage des protéines. Le rythme s'exprime en pourcentage de mutations par unité de temps ; généralement il est de quelques % pour un milliard d'années : la longueur des branches des arbres phylogénétiques représente alors un temps et non plus une unité arbitraire. Ces dernières années, l'ADN mitochondrial a acquis une importance considérable parce que sa vitesse de fixation des mutations est beaucoup plus rapide (jusqu’à 10 fois chez les Mammifères) que celle de l'ADN nucléaire : les mutations affectent deux à quatre nucléotides sur cent par million d'années. Cette horloge au rythme si rapide, qui permet de dater des phénomènes très récents, est utilisée en archéologie pour calculer l'âge des fossiles d'Hominidés et des ancêtres directs de l'Homme.
Les contestations
Les résultats établis à partir de l'horloge ont bouleversé les données paléontologiques, car ils ont conduit à estimer la séparation Homme­Chimpanzé à 5 Ma, alors que les fossiles, dont un petit nombre seulement étaient en bon état, la plaçaient à 15 Ma. Mais quinze ans après, en expérimentant plusieurs méthodes de séquençage des protéines, de l'ADN nucléaire, de l'ADN mitochondrial, l’horloge moléculaire a confirmé l'origine récente des Hominidés (5 à 10 Ma). La reconnaissance de cette origine récente vient de la découverte d’Ardipithecus ramidus, 112
forme très proche des Australopithecus, daté de 4,5 Ma, dont les caractères anatomiques sont intermédiaires entre ceux de l’Homme et ceux du Chimpanzé.
D'autres biologistes, tel Morris GOODMAN (1981), ont contesté également la régularité de l'horloge. Ils pensent que l'évolution suit le rythme des fixations des mutations, qui augmenterait au moment des périodes de radiation adaptative. Pour étayer leur thèse, ils prennent l'exemple extrême des gènes des hémoglobines α et β, chez lesquels la fréquence des mutations par substitution est très élevée lors de leur individualisation et de leur séparation. Cette fréquence est interprétée comme un phénomène peu courant : la sélection naturelle, dite positive, a favorisé les mutations qui ont permis à la fonction de l'hémoglobine de progresser. Dans l'immense majorité des cas, en revanche, la sélection naturelle est négative, c'est­à­dire qu'elle élimine les mutations.
Les erreurs et leurs remèdes
Les erreurs peuvent provenir d'estimations faussées :
1) Si les mutations s’annulent mutuellement, le gène est maintenu dans son état ancestral ; la datation de son apparition est alors sous­estimée, car le faible nombre de mutations apparentes lui donne un âge plus récent qu’il ne l’est en réalité.
2) Si la sélection naturelle augmente le rythme des mutations, le gène sera considéré comme plus ancien qu'il ne l'est.
3) Si deux lignées qui ont divergé s'hybrident, les gènes des hybrides seront donnés pour récents.
Dans une population, le nombre de mutations par génération (taux de mutation) peut être élevé, mais on ne peut étudier que les mutations fixées ; le taux de fixation (nombre de mutations fixées par génération) dépend ­ en raison de la dérive génique fortuite ­ de l'effectif des populations.
Pour améliorer la fiabilité de l'outil, les biologistes s'accordent maintenant sur ces conditions à respecter : ­ Les ressemblances entre les organismes étudiés doivent provenir de leur parenté ; mais la comparaison des séquences homologues n’élimine pas toutes les homoplasies.
­ Le nombre de leurs différences doit être proportionnel à l'ancienneté de leur séparation d'un ancêtre commun. Mais on ne peut le savoir a priori.
­ Les lignées qui ont divergé ne doivent pas être mélangées. Généralement, elles ne le sont pas si l’on compare des espèces.
113
En définitive, il semble que l'hypothèse de l'horloge moléculaire soit utilisable pour des lignées voisines et non pour des lignées trop éloignées, car dans ce dernier cas, l'horloge souffre de dysfonctionnement.
Le test de la fréquence relative
Pour éviter les désaccords fréquents au sujet de la datation des divergences de lignées, Vincent SARICH et Allan WILSON ont mis au point, en 1973, un test sans datation absolue : celui de la fréquence relative. Plusieurs propositions doivent être admises :
1) Le fonctionnement de l'horloge est régulier.
2) Après divergence, les lignées évoluent à la même vitesse.
3) Le test utilise trois lignées, deux dont on veut apprécier le degré de divergence et la troisième, servant de référence, qui s'est séparée d'un tronc commun bien avant les deux premières (c'est la notion de l'UE extra­groupe déjà évoquée plus haut).
L'arbre phylétique de ces trois lignées A, B et C possède l'aspect représenté à la figure 2.19
La fréquence des mutations par substitution de l'espèce A par rapport au point O est Koa, celle de l'espèce B est Kob et celle de C est Koc. On peut écrire les égalités suivantes :
(1) Kac = Koa + Koc
114
(2) Kbc = Kob + Koc
(3) Kab = Koa + Kob
Si l'horloge est régulière, on peut écrire :
(4) Koa = Kob et d'après les égalités (1) et (2) :
(5) Koa ­ Kob = Kac ­ Kbc
L'égalité (5) permet donc d'apprécier le rythme de fixation des mutations de A et de B par rapport à C. En fait, le taux de fixation dépend à la fois de l'effectif de la population, en raison de la dérive génique fortuite (voir les sections 3.1.3 : « La variabilité et la dérive génique fortuite », 3.3.2 : « La spéciation par révolution génétique », 4.2.3 : « La théorie synthétique » et 4.3.2 : « La théorie neutraliste, le hasard ») et du taux de mutations par génération qui est, seul, pris en compte ici.
Les fréquences de mutations fixées synonymes sont égales chez la Souris (A) et le Rat (B), l'espèce (C) de référence est l'Homme (fig. 2.20).
115
En revanche, elles sont deux fois plus fréquentes chez le Singe africain (A) que chez l'Homme (B), l'espèce (C) de référence est le Lémur pour l'exemple de la β­globine et le Chien pour celui de l'insuline (fig. 2.20).
Le Rat et la Souris possèdent par rapport à l'Homme un taux de mutations et un taux de fixation beaucoup plus élevés que ceux du Singe. Deux explications non exclusives rendent compte de ces différences :
1) La durée de vie d'une génération est plus courte chez le Rongeur que chez le Singe, et chez ces derniers que chez l'Homme. Le rythme de vie des cellules des Rongeurs est accéléré ; les divisions cellulaires plus fréquentes impliquent de nombreuses réplications de l'ADN, au cours desquelles les mutations peuvent s'accumuler rapidement.
2) Le système de réparation de l'ADN au moment de sa réplication est moins performant chez les animaux que chez l'Homme, comme l'indiquent les études sur les Rongeurs réalisées par Roy BRITTEN (1986). Avant la division cellulaire, la réplication de l'ADN est effectuée par l'ADN­polymérase, complexe enzymatique, qui, après avoir contrôlé la conformité des brins néoformés aux brins originaux, corrige les erreurs de transcription.
L'horloge moléculaire est donc fiable pour des lignées proches qui possèdent une physiologie cellulaire comparable, mais aussi une durée de vie semblable.
2.2.3 ­ La méthode cladistique
Alors que les phénogrammes représentent des degrés de ressemblances, les cladogrammes représentent des relations de parenté.
Les particularités des caractères employés
Les cladistes admettent que les caractères évoluent indépendamment les uns des autres et à des vitesses souvent inégales : la présence de cinq doigts à la main de l'Homme est un caractère ancestral ou plésiomorphe, alors que la présence d'un cortex plissé est un caractère dérivé ou apomorphe. Des vitesses différentes pour des caractères différents donnent ce que Gavin De BEER (1954) a nommé une évolution en mosaïque. Les variations de vitesse n'ont aucune répercussion sur l'élaboration de l'arbre phylogénétique, dont la construction est indépendante du temps et ne nécessite pas le postulat de l’horloge moléculaire. Les cladistes appliquent dans leurs recherches et dans l'établissement du cladogramme le principe de parcimonie : utilisation d'un nombre minimum d'hypothèses, choix du cladogramme le plus court.
116
La construction d'un cladogramme implique au préalable le choix de certains caractères dont il faut trouver les états plésiomorphes (ancestraux) et les états apomorphes (dérivés). La parenté plus ou moins proche des UE est, en effet, déterminée par le partage de caractères apomorphes (synapomorphie) et non par la présence commune de plésiomorphies. La reconnaissance des plésiomorphies et des apomorphies nécessite l'emploi de plusieurs critères dont les deux premiers sont les plus importants :
­ Le critère de comparaison extra­groupe : un groupe non directement apparenté à celui étudié sert de référence. « ... Étant donné un caractère rencontré dans un groupe, si le caractère est rencontré également à l’extérieur du groupe il est primitif pour le groupe étudié ; si le caractère n’est rencontré que dans le groupe étudié il est dérivé » (P. TASSY, L’Arbre à remonter le temps, Paris, Christian Bourgois, 1991, p. 165).
­ Le critère ontogénique déjà évoqué, qui est issu d'une nouvelle formulation de la loi de récapitulation. Les caractères apparaissent dans un ordre qui correspond à celui de leur généalogie ; les premiers caractères développés sont les plus « primitifs », les suivants sont de plus en plus « modernes ».
­ Le critère paléontologique : si un caractère est partagé par des fossiles, le fossile le plus ancien présente le caractère plésiomorphe. Ce critère n'est valable que si les fossiles appartiennent à un groupe monophylétique.
­ Le critère de distribution géographique, qui est presque abandonné. Un caractère apomorphe apparaît dans une espèce loin de l'aire de répartition principale de cette espèce.
Les cladistes travaillent sur des caractères apomorphes ou dérivés, mais aussi homologues afin que ces derniers demeurent comparables. Ils ont donc à rechercher les caractères homologues. Ils retracent la phylogénie de groupes monophylétiques, c'est­à­dire d'un ensemble de taxons étroitement apparentés ; lorsque les taxons ne le sont pas, le groupe est dit paraphylétique. Les taxons apparentés forment des groupes frères. Parfois certains caractères ne sont pas partagés avec des groupes frères, ils sont particuliers à un seul groupe ; on parle dans ce cas de caractères autapomorphes ou d'autapomorphies. La figure 2.21 résume quelques points exposés ci­dessus.
117
La reconnaissance des homologies
Après avoir reconnu les caractères dérivés et les caractères ancestraux, le problème fondamental est d'identifier les homologies avec la plus grande certitude. Les cladistes disposent de trois critères :
­ Le critère de ressemblance, qui correspond au principe des connexions de É. GEOFFROY SAINT­HILAIRE. Un organe maintient avec ses voisins toujours les mêmes connexions, qui sont invariables. Par conséquent, des organes d’espèces différentes sont homologues s’ils ont des connexions identiques avec leurs voisins.
­ Le critère de non­coexistence : deux caractères homologues ne peuvent coexister chez un même organisme. C'est pourquoi les Centaures sont de pures inventions mythologiques, car ils cumulent « bras » et « pattes antérieures ».
­ Le critère de parcimonie (ou de congruence). Toutes les conclusions adoptées sont issues de l'utilisation d'un nombre d'hypothèses aussi faible que possible.
La notion d’homologie, fondamentale dans l’analyse cladistique, est appliquée également aux molécules. Mais l’assimilation courante d’une ressemblance ou d’une similitude moléculaire à une homologie heurte les convictions de certains spécialistes qui considèrent ce rapprochement abusif. C’est pourquoi W. FITCH (1970) a proposé la création de deux termes spécifiques à la biologie moléculaire : « orthologue » et « paralogue », celui d’homologue étant réservé aux caractères morphologiques. Le terme « orthologue » qualifie des séquences similaires issues d’ascendants communs ; le terme « paralogue » désigne des séquences dont la similitude est 118
acquise par des mutations ou par des remaniements génétiques dans des lignées différentes ; dans tous les cas, la paralogie est acquise indépendamment de la spéciation. Les caractéristiques du cladogramme
Le cladogramme possède des branches internes dont la longueur est proportionnelle au nombre de caractères apomorphes. En revanche, la longueur des branches terminales est déterminée par le nombre de caractères autapomorphes. Le cladogramme n'est pas obligatoirement enraciné ; seules les relations de parenté sont indiquées. L'introduction d'un extra­groupe permet son enracinement ; l'ancêtre situé à la racine comme ceux présents aux différents noeuds de l'arbre sont totalement hypothétiques, puisqu'ils sont déduits des caractères de leurs descendants.
119
Il arrive que plusieurs arbres soient aussi parcimonieux, bien qu'ils aient des configurations différentes (fig. 2.22). Des homoplasies non détectées en sont responsables. Le cladogramme, comme le phénogramme, n'est pas directement phylogénétique à moins d'introduire des hypothèses évolutives : les observations sont équivalentes, les caractères évoluent indépendamment, les caractères se transforment...
120
Le cladogramme est parfois qualifié indifféremment d’arbre « généalogique » ou d’arbre « phylogénétique ». Or ces deux termes ne sont pas tout à fait équivalents : ­ Dans un arbre généalogique, les ancêtres sont connus et bien identifiés.
­ Dans un arbre phylogénétique (un cladogramme), les ancêtres ­ comme, d’ailleurs, les intermédiaires ­ ne sont pas connus, mais ils sont inférés par les caractères qu’ils ont légués à leurs descendants. Seules les relations de parenté entre les U.E terminales sont mises en évidence.
L'établissement d'un cladogramme
L'exemple choisi concerne des données moléculaires d'une protéine homologue ­ l'hémoglobine ­ de plusieurs Primates. Par l'analyse des séquences partielles de la myoglobine des 11 Singes, on reconstitue la séquence ancestrale en appliquant le critère de parcimonie : le caractère typique ancestral est le plus fréquent ­ c'est­à­dire, dans cet exemple, l'acide aminé le plus fréquent ­ puisque sa détermination nécessite un minimum d’hypothèses.
Au lieu de reconstituer une classification généalogique comme dans le phénogramme, on veut suivre les étapes de l'évolution en reconstituant les relations de parenté qui unissent, par exemple, le Singe laineux ou Lagothrix (La), le Saimiri (Sai) et le Marmouset (Mar). Trois arbres sont possibles (voir figure 2.23).
121
La construction du cladogramme obéit également aux principes de parcimonie et de vraisemblance. Ignorant les probabilités de chaque mutation, les cladistes supposent que les différents types de mutations (substitution, insertion et délétion) ont une fréquence identique. Par exemple, les transformations Phe­­­­> Leu, Ile­­­­> Val, 122
Val­­­­> Ala... se produisent au même rythme. Retracer l'apparentement des trois espèces de Singes, le Lagothrix (La), le Saïmiri (Sai) et le Marmouset (Mar), exige l'exploration des filiations possibles qui, limitées à trois, sont présentées dans la figure 2.23. Pour bâtir l'un des trois cladogrammes, on choisira la solution exigeant les manipulations les moins nombreuses.
Le critère de référence est la séquence ancestrale. Dans le cas du cladogramme 2.23­A, le passage direct de la séquence ancestrale à la séquence (Sai) a nécessité 5 mutations, signalées sur la branche du cladogramme ; le passage à la séquence (Mar) 1 mutation, et le passage à la séquence (La) 3 mutations. Trois de ces neuf mutations sont des convergences, car elles figurent sur deux branches au moins:
1ère convergence Val­­­­>Ile position 1 chez (Sai) et (La)
2e convergence His­­­­>Gln position 3 chez (Sai) et (La)
3e convergence Ile­­­­>Val position 5 chez (Sai) et (Mar)
Les 9 mutations et les 3 convergences forment 12 événements.
Pour bâtir le cladogramme 2.23­B, 7 mutations sont nécessaires, dont une convergence : Ile­­­­>Val position 5 chez (Mar) et (Sai), soit un total de 8 événements.
Le cladogramme 2.23­C utilise 8 mutations, dont deux convergences et une réversion :
1ère convergence Val­­­­>Ile position 1 chez (Sai) et (La)
2e convergence His­­­­>Gln position 3 chez (Sai) et (La)
Le principe de parcimonie situe la mutation Ile­­­­>Val en position 5 sur la branche commune à (Sai) et (Mar), plutôt que sur chacune des deux branches ; il est plus vraisemblable également que cette mutation s'est produite une fois au lieu de deux. Quoi qu'il en soit, cette mutation placée sur une branche commune, et non pas sur les deux branches séparées, est une réversion. Le nombre d'événements est égal à 8 mutations + 2 convergences + une réversion, soit 11 événements.
Finalement, le cladogramme retenu est le 2.23­B, car 8 événements en font le plus économique, et l’on admet qu’il retrace la phylogénie la plus exacte.
123
Discussion sur l'existence de la parcimonie dans l'évolution
Le principe de parcimonie est abondamment utilisé sans que l’on sache pour autant si l'évolution est réellement parcimonieuse. Si les événements évolutifs (mutations) sont rares, la parcimonie de l'évolution est admise. En revanche, elle est rejetée si l'on pense que les homoplasies sont aussi fréquentes que les homologies et qu'elles ne renvoient à aucun modèle évolutif.
Si l’emploi du terme « parcimonie » est récent (1965), le principe en est ancien. Guillaume d’OCKHAM (1288­1349) l’a introduit définitivement dans la démarche scientifique : la meilleure explication d’un fait est celle qui utilise le minimum d’hypothèses. La science actuelle continue à rejeter les hypothèses ad hoc, c’est­à­
dire celles qui ne sont pas nécessaires à la compréhension d’un fait particulier. Il est donc admis qu’un caractère dérivé partagé par deux taxons est hérité d’un ancêtre commun ; et l’hypothèse soutenant l’apparition indépendante de ce même caractère chez les deux taxons est rejetée parce qu’elle est moins parcimonieuse que la première.
Les méthodes phénétiques utilisent des critères de ressemblance issus de caractères plésiomorphes (ancestraux). Elles traitent aussi bien les homologies que les homoplasies, convergences et réversions. Pourtant cet amalgame fausse la reconstruction phylogénétique, car il réunit des espèces non étroitement apparentées, qui ont adopté une même solution adaptative. La méthode cladistique s’attache, autant que possible, à limiter la prise en compte des homoplasies. C’est pourquoi le choix des caractères de référence est très strict et l’arbre le plus parcimonieux est retenu. La parcimonie permet de dégager un arbre qui se rapproche le plus possible de la phylogénie réelle, car il est bâti à partir d’un maximum d’homologies et d’un minimum d’homoplasies.
Deux autres méthodes existent également, mais elles sont beaucoup moins employées. La méthode de compatibilité, l'arbre choisi est celui qui ne nécessite pas l'hypothèse de l'homoplasie. La méthode probabiliste, l'évolution obéit à certaines lois probabilistes définies a priori, l'arbre choisi est le plus probable.
Dans la reconstitution des filiations, l’anatomie comparée occupe une place importante, car quelques indices suffisent pour reconstituer tout un ensemble, qu’il est alors possible d’intégrer dans une histoire évolutive.
124
Bibliographie de la section 2.2
Livres
DARLU P. et TASSY P. , Reconstruction phylogénétique, concept et méthodes, Paris, Masson, 1993.
LECOINTRE G. et LE GUYADER H. , Classification phylogénétique du vivant, Paris, Belin, 2001.
LI W. et GRAUR D. , Molecular evolution, Sunderland (Massachussetts, USA), Sinauer Associates Inc., 1991.
NINIO J. , Approches moléculaires de l'évolution, Paris, Masson, 1979. TASSY P., L’Arbre à remonter le temps, Christian Bourgois, 1991.
Le Message des fossiles, Paris, Hachette, 1992.
TASSY P. (coordonné par), L’Ordre et la diversité du vivant, Paris, Fayard, 1986.
Articles
BOULIGAND Y. , « Morphologie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
DEVILLERS Ch. , « Homologie/analogie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
GASC J.­P. , « Tendances évolutives et progrès », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
GÉNERMONT J. , « Dendrogramme », « Horloge moléculaire de l'évolution », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
GILLOIS M. : « Homologie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
GOUJET D. , « Arbre phylogénétique », « Cladisme », « Grade », « Hennig », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
GUY Y. , « Phylogénétique (arbre)», Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
JANVIER Ph., TASSY P. et THOMAS H. , « Le cladisme », La Recherche, n° 117, décembre 1980.
125
LECOINTRE G. , « La construction des phylogénies », APBG (revue de l'Association des Professeurs de Biologie et de Géologie), n° 1, 1995.
TASSY P., « La critique cladistique du néo­darwinisme et comment s’en servir », Pour Darwin (dir. P. TORT), Paris, PUF, 1997.
TORT P. , « Adanson », « Monophylie/ polyphylie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
126
Téléchargement