Le Bulletin des BioTechnologies – Juillet 2003 – n°208
2
Ces duplications donnant ce que l'on appelle des
gènes paralogues, ont une fréquence très variable, ce
qui indique que leur prolifération est probablement
sélectionnée. Car il faut réaliser que la multiplicité des
gènes des immunoglobulines (avec des dizaines de
gènes) ou des récepteurs olfactifs en constituent des
exemples extrêmes.
Le millier de gènes de récepteurs olfactifs est un
exemple intéressant, car si la souris possède le même
nombre de gènes de ces récepteurs que l'homme (et
probablement les autres mammifères), 60% d'entre
eux ont dégénéré en pseudogènes chez l'homme,
alors que ce n'est le cas que de 20% d'entre eux chez la
souris, dont l'olfaction est un des sens primordiaux,
contrairement à ce qui s'est passé chez l'homme.
Ceci permet d'aborder le sort de ces duplications
au cours de l'évolution.
On a calculé qu'une duplication est stabilisée (on
dit fixée) fonctionnellement tous les 100 millions
d'années chez les eucaryotes, de la levure à l'homme.
La stabilisation d'un gène dupliqué dépend de la
sélection appliquée. Naissance et mort d'un tel gène
sont, certes, un évènement fréquent, mais la survie
dépend de la pression de sélection pour la fonction
assurée. La plupart du temps il y a pseudogénisation,
avec accumulation de mutations diverses amenant la
séquence au stade de séquence toute faite de réserve,
utilisée ou pas et, si elle ne l'est pas, devenant de plus
en plus aléatoire et donc neutre sur le plan évolutif. Il
existerait ainsi un pseudogène pour deux gènes
fonctionnels dans le génome humain. Un gène
dupliqué devient un pseudogène dans les quelques
premiers millions d'années suivant la duplication.
Il arrive, cependant, qu'un pseudogène puisse
assurer une fonction. Il existe un seul gène
fonctionnel de chaîne lourde variable
d'immunoglobulines chez le poulet. La diversité des
immunoglobulines est alors assurée par conversion
génique à partir des pseudogènes situés en amont de
ce gène. Les pseudogènes servent donc de réserve
génétique, bien qu'ils ne soient plus fonctionnels. La
variabilité utilisée est donc celle libérée par la
pseudogénisation (qui n'est pas contrainte du fait que
les gènes ne sont pas exprimés).
Le gène de la ribonucléase pancréatique des
ruminants a subi une duplication qui a eu lieu avant
la diversification des ruminants, il y a 35 millions
d'années. Or, chez les bovins, le gène dupliqué est
exprimé dans la semence et l'enzyme est
fonctionnelle, alors que, chez les autres ruminants,
elle est non fonctionnelle, ou le gène n'est plus
exprimé. Ceci indique que la séquence a très
longtemps été conservée sous la forme d'un
pseudogène avant de récupérer sa fonction chez les
bovins pour une raison inconnue.
La conservation des deux gènes issus de la
duplication peut être sélectionnée dans le cas de
produits géniques nécessaires en abondance. Ce
sont souvent des duplications par conversion génique
(il faut une conservation des séquences régulatrices et
des introns) qui sont à l'origine de ces duplications. Ils
sont alors soumis à une évolution concertée des
séquences, et une purification par sélection évite,
surtout, les divergences.
Une autre issue possible est la
subfonctionnalisation. Pas mal de protéines ont une
double fonction ou une double localisation de
l'expression, l'une majeure, l'autre secondaire. Une
divergence entre les deux copies permet d'amplifier
cette différence car la redondance laisse de la marge
aux variations des séquences. C'est le cas pour les
gènes dupliqués engrailed-1 et engrailed-1b du
poisson-zèbre. Il en existe un seul orthologue chez la
souris avec engrailed-1. Le gène unique de la souris
est exprimé dans les bourgeons des membres et dans
le système nerveux central, alors que ces deux
localisations sont distribuées entre les deux gènes
des poissons osseux.
Un exemple de divergence dans la fonction (issu des
travaux de l'auteur) est celui des singes colobidés. Ces
singes se nourrissent de feuilles, alors que les autres
singes sont consommateurs de fruits ou d'insectes. Ce
sont des "ruminants", qui consomment en réalité les
bactéries qui fermentent les feuilles. Ils possèdent, en
effet, une sorte de panse antérieure. Comme chez les
ruminants, ils produisent beaucoup de ribonucléase
pancréatique (permettant de bien recycler l'azote des
acides nucléiques). Le gène de la RNase1 est dupliqué
en RNase1B chez le Colobe asiatique Pygathrix
nemaeus. (voir J Zhang et al.; Nature Genetics 30
(APR02) 411–415. Le gène de la RNase1B a évolué
beaucoup plus rapidement que celui de la RNase1, les
substitutions non synonymes (donnant donner un
acide aminé différent) sont, en effet, beaucoup plus
nombreuses dans ce gène que dans sa copie originale
persistante. Reste à expliquer la persistance d'une
duplication fonctionnelle. Ce n'est pas une redondance
parfaite qui a été sélectionnée, mais une adaptation au
pH intestinal relativement acide (pH6,3) de ce colobe
(alors que celui d'un singe Rhésus est de 7,4 à 8) ou la
RNase1B est six fois plus active que la RNase1, alors
que le pH opt est le même avec 7,4 pour les deux
RNases. Par ailleurs, la RNase1 a une autre fonction,
mineure, qui est celle d'une RNase double brin. Cette
fonction est déprimée de 300 fois pour la RNase 1B. Il
y a donc une adaptation et une spécialisation des
deux gènes dupliqués.
On retrouve cette spécialisation dans les deux
opsines rétiniennes des primates du Vieux Monde
permettant la perception du rouge et du vert liée à
deux substitutions. Mais ces "néofonctionnalisations"
peuvent comporter de très nombreuses substitutions et
l'on peut se demander quelle a été la fonction de la
protéine entre temps, pour qu'elle ait été conservée.
L'auteur traite ensuite des forces qui sont derrière
ces modifications géniques. La sélection est évidente
quand on observe nettement plus de mutations non
synonymes que de synonymes après la duplication. La
divergence peut résulter de l'apparition d'une nouvelle
fonction, faible mais utile, qui est alors l'objet d'une
sélection positive. Elle peut résulter également de
l'amélioration d'une fonction secondaire préexistante,
qui devient primaire dans un des deux gènes.
3.### Un article de chercheurs du TIGR (The
Institute for Genomic Research) discute des apports
respectifs de la "génomique " et des données de
l'évolution: JA Eisen et al.; Science 300 (13JUN03)
1706-1707.