Formation et évolution des rétrovirus endogènes
David Ribet
1,2
Thierry Heidmann
1,2
1
Institut Gustave-Roussy,
CNRS UMR 8122,
Unité des rétrovirus endogènes
et éléments rétroïdes
des eucaryotes supérieurs,
F-94805 Villejuif, France
2
Université Paris-Sud,
F-91405 Orsay, France
Résumé. Les rétrovirus endogènes (ERV) sont des parasites génétiques des
génomes des vertébrés. Ils sont les « traces » dinfections ancestrales par des
rétrovirus ayant intégré leur génome dans la lignée germinale dun hôte et
sétant ensuite transmis de façon verticale de génération en génération. À la
suite de la colonisation de la lignée germinale, ces éléments peuvent évoluer
de différentes façons. Certains ERV peuvent proliférer dans lADN de leur
hôte, aboutissant à la formation de familles multicopies et à lenvahissement
du génome de populations entières. Dautres éléments peuvent progressive-
ment dégénérer et perdre leur capacité de multiplication et ne subsister quà
létat de séquences fossiles dans le génome hôte. Enfin, certains ERV peuvent
être conservés, entièrement ou partiellement, par une pression de sélection
positive sils apportent un bénéfice à leur hôte en termes de succès évolutif.
Cette diversité dévolution a permis de façonner, chez les différentes espèces
de vertébrés, des répertoires très variés dERV.
Mots clés
:
rétrovirus endogène, lignée germinale, rétrotransposition,
intracellularisation, placenta
Abstract. Endogenous retroviruses (ERV) are genetic parasites found in the
genome of vertebrates. They are « remnants » of ancient infections by retroviru-
ses that have integrated a copy of their genome in the germline of their host and
have then been transmitted vertically to the progeny. A germline-integrated
retrovirus can have multiple fates. Some elements can amplify in the host
DNA, leading to the formation of multicopy families and the genomic invasion
of entire populations. Some elements can gradually degenerate and remain only
as fossil records in the host genome. Finally, some ERV can be conserved, either
completely or partially, due to positive selection if their presence is beneficial for
the fitness of their host. These different evolutions have led to the generation of
diversified patterns of ERV in the different species of vertebrates.
Key words
:
endogenous retrovirus, germline, retrotransposition,
intracellularization, placenta
Introduction
Les génomes eucaryotes sont envahis par un nombre très
important de « parasites génétiques » ayant la capacité de
se déplacer et de se multiplier au sein de lADN qui les
héberge. Ces éléments se regroupent en plusieurs classes,
en fonction de leur origine évolutive et de leur mode de
colonisation du génome de lhôte. Les quatre classes prin-
cipales retrouvées chez les eucaryotes sont les transposons
à ADN, les rétrotransposons sans LTR (long terminal
repeat), les rétrotransposons à LTR et les rétrovirus
endogènes (ou ERV pour endogenous retroviruses).
La capacité de multiplication et de colonisation du génome
hôte par ces différents éléments est très variable suivant
les espèces. Chez les mammifères, les seuls éléments
mobiles actuellement caractérisés appartiennent aux classes
des ERV et des rétrotransposons sans LTR (les éléments
LINE et SINE). La plupart des autres séquences identifiées
correspondent à des traces fossiles danciens éléments ayant
perdu leur capacité de se multiplier.
Les ERV possèdent une structure très proche des rétro-
virus dits « classiques » (comme les virus MMTV (mouse
mammary tumor virus), ALV (avian leukosis virus)ou
MPMV (Mason-Pfizer monkey virus). Ils possèdent
Virologie 2010, 14 (2) : 141-50
doi: 10.1684/vir.2010.0294
Tirés à part : D. Ribet
revue
Virologie, Vol. 14, n
o
2, mars-avril 2010 141
Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017.
généralement quatre gènes homologues aux gènes gag,
pro,pol et env de rétrovirus, bordés par deux LTR (figure 1).
Les ERV font partie intégrante du génome de leur hôte et
peuvent représenter une proportion importante de celui-ci
(8 à 10 % de la longueur totale du génome chez lhomme et
la souris [1, 2]). Ces éléments sont les « traces » dinfec-
tions ancestrales par des rétrovirus ayant atteint la lignée
germinale de leur hôte.
Mécanisme dendogénisation
dun rétrovirus
Les rétrovirus sont des virus enveloppés à ARN ayant la
capacité, au cours de leur cycle dinfection, dintégrer une
copie de leur génome dans lADN de la cellule infectée.
Cette propriété remarquable permet une association perma-
nente entre le parasite et son hôte. Lexpression des gènes
viraux intégrés dans lADN de la cellule infectée permet la
production de nouveaux virions. Ces virions participent à la
propagation de linfection par une transmission dite « hori-
zontale ». Chaque rétrovirus possède un tropisme donné et
infecte un nombre limité de cellules chez un individu.
La plupart du temps, les cellules infectées sont des cellules
somatiques. Dans certains cas, cependant, un rétrovirus
peut infecter une cellule appartenant à la lignée germinale
dun individu, cest-à-dire intervenant dans la formation
des gamètes. Le génome viral intégré sera alors retrouvé
dans le génome des gamètes et potentiellement dans une
cellule œuf, si ces gamètes participent à un événement de
fécondation. À partir de ce moment, toutes les cellules de
lorganisme en devenir, dérivant de la cellule œuf initiale,
posséderont une copie du génome viral dans leur ADN.
Le provirus intégré fait alors partie intégrante du génome
de lorganisme : il est devenu « endogène » (figure 2).
Il continuera dêtre transmis verticalement, à la descen-
dance de lhôte, indépendamment de sa capacité à produire
des virions fonctionnels.
Lanalyse phylogénétique des différents ERV actuellement
identifiés montre quils dérivent de différentes classes de
rétrovirus. Il existe ainsi de très nombreux exemples
gag pol env
U3 RU5
PBS PPT
LT R
Ψ
pro
AAAAA ARNm gag-pro-pol
AAAAA ARNm env
U3 RU5
LT R
Figure 1. Organisation génomique dun rétrovirus endogène (ERV).
Lorganisation génomique dun ERV est identique à celle dun rétro-
virus « classique » intégré dans lADN de son hôte. Les ERV sont
bordés par deux LTR (long terminal repeat), chacun composé de
domaines U3, R et U5, impliqués, entre autres, dans le contrôle
de la transcription des gènes du rétrovirus. Les ERV possèdent
en général quatre gènes homologues aux gènes gag,pro,pol et
env de rétrovirus, ainsi que des séquences régulatrices rétrovirales
comme un PBS (primer binding site), une séquence dencapsida-
tion (Ψ) ou un PPT (polypurine tract). Linsertion dun ERV est
caractérisée par une courte duplication dune séquence du
génome hôte se retrouvant de part et dautre du provirus intégré
(triangles noirs).
TRANSMISSION
HORIZONTALE
virus infectieux
INFECTION
RÉTROVIRALE
TRANSMISSION
VERTICALE
génome viral
ENDOGÉNISATION
INFECTION
LIGNÉE GERMINALE
Figure 2. Mécanisme d« endogénisation » dun rétrovirus.
Linfection dun individu par un rétrovirus aboutit à lintégration du
génome viral dans un nombre limité de cellules de lorganisme
(points rouges). La production de nouveaux virions infectieux per-
met une transmission horizontale de linfection, dun individu à un
autre. Dans le cas particulier où un rétrovirus infecte des cellules de
la lignée germinale dun individu, le génome viral est transmis à la
descendance, indépendamment de sa capacité à produire des
virions infectieux. Le rétrovirus devient endogène et est présent
dans lensemble des cellules des descendants.
revue
142 Virologie, Vol. 14, n
o
2, mars-avril 2010
Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017.
dERV dérivant dalpha-, de bêta- ou de gammarétrovirus.
Il existe également quelques exemples dERV présentant
des similarités de séquences avec des spumavirus [3-5] ou
des lentivirus [6, 7]. Par ailleurs, même si la plupart des
ERV identifiés ont une organisation dite « simple » et ne
possèdent que les gènes gag,pro,pol et env, il existe
quelques ERV avec une organisation dite « complexe »,
codant pour des protéines accessoires [8]. Il est très
probable que la diversité des ERV soit aussi riche que
celle des rétrovirus « classiques ». En effet, à partir du
moment où un rétrovirus, quel quil soit, est capable de
sintégrer dans la lignée germinale dun hôte, il est
potentiellement capable de générer une famille dERV.
La recherche dERV dans le génome de nouvelles espèces
viendra probablement enrichir et compléter la diversité des
ERV déjà recensés.
La plupart du temps, le rétrovirus ancestral ayant donné
naissance à une famille dERV a disparu, et seules les
formes endogénisées subsistent. Il est donc difficile de
caractériser les éventuelles modifications du virus initial
associées à son endogénisation. Il existe cependant un
exemple de rétrovirus actuellement en cours dendogénisa-
tion chez un mammifère : le virus KoRV (pour koala
retrovirus) [9]. Ce virus possède un statut intermédiaire
entre rétrovirus exogène et ERV. Dune part, le virus
KoRV possède les caractéristiques dun rétrovirus
« classique » puisquil est capable de produire des parti-
cules virales infectieuses se transmettant horizontalement.
Dautre part, il existe des copies endogénisées de KoRV,
intégrées dans la lignée germinale de koalas et se transmet-
tant de façon mendélienne à la descendance de lhôte.
De façon remarquable, ces copies KoRV endogénisées ne
sont pas présentes chez tous les koalas : leur nombre et
leur nature varient de façon importante suivant les indi-
vidus. Il a donc été proposé que ce virus ne soit entré que
très récemment dans la lignée germinale des koalas, il y a
seulement 200 ans [9]. Le virus KoRV constitue un outil
très intéressant pour étudier les modifications associées à
lendogénisation dun rétrovirus. La comparaison des
génomes de KoRV et dun virus phylogénétiquement très
proche, le virus GALV (gibbon-ape leukaemia virus), a
permis didentifier des mutations dans les gènes gag et
env de KoRV associées à la faible infectiosité de ce virus
[10]. Le gène gag de KoRV présente, en particulier, des
mutations dans un domaine important pour le bourgeonne-
ment des particules virales, appelé domaine L (pour « late
domain »). Ces mutations entraîneraient une diminution de
lefficacité de bourgeonnement des particules virales
KoRV. Les mutations identifiées dans le gène env de
KoRV sont associées, elles, à une diminution des effets
cytopathiques de cette glycoprotéine denveloppe par
rapport à celle de GALV. Il a été proposé que ces différentes
mutations correspondent à des changements adaptatifs du
virus KoRV, ayant permis de réduire sa pathogénicité et
ayant facilité son entrée et sa persistance dans la lignée
germinale du koala [10].
Devenir dun ERV après endogénisation
Comme illustré avec lexemple du virus KoRV, un rétro-
virus récemment endogénisé peut, au moins pendant un
certain temps, continuer à produire des particules virales
infectieuses et être transmis horizontalement en plus
dêtre transmis verticalement. Ce cas est également
retrouvé chez la souris certains rétrovirus MLV et
MMTVendogènes sont capables de se propager horizonta-
lement par infection [17]. La production de particules
virales infectieuses réinfectant épisodiquement la lignée
germinale de lhôte permet daugmenter le nombre
de copies dERV transmises à la descendance. Certains
ERV peuvent également samplifier dans la lignée germi-
nale en adoptant un mode de multiplication strictement
intracellulaire.
La présence dun ERV se multipliant activement peut avoir
des conséquences néfastes pour lorganisme hôte. En effet,
linsertion de séquences dorigine rétrovirale dans un
génome peut induire de nombreuses perturbations comme
linterruption de phases ouvertes de lecture, la perturbation
de la transcription ou de lépissage de gènes environnants
ou linduction de recombinaisons non homologues. Il a
dailleurs été montré que les ERV étaient retrouvés plus
fréquemment dans les régions intergéniques que dans les
unités de transcription. Dans le cas dintégrations dans
des introns, les ERV sont majoritairement retrouvés en
orientation antisens par rapport au sens de transcription
du gène ciblé (limitant ainsi les perturbations dues aux
sites dépissage ou de polyadénylation présents dans le
génome des ERV [11]). Ce biais nétant pas retrouvé pour
les intégrations de novo de rétrovirus « classiques », il
reflète les pressions de sélection exercées au cours de
lévolution en faveur des insertions dERV limitant la
perturbation de lexpression des gènes de lhôte [11, 12].
Lexpression des protéines dun ERV peut également avoir
des effets néfastes sur la biologie de lhôte (lexistence dun
lien entre ERV et pathologie chez lhomme restant un sujet
encore largement débattu [13]).
En conséquence, un ERV dont la présence est trop
« délétère » pour son hôte ne sera jamais présent avec une
fréquence élevée dans la population. Il est ainsi probable
que, dans un grand nombre de cas, une inactivation
partielle ou complète de lERV ait accompagné sa fixation
chez son hôte. Cette inactivation peut se faire soit par accu-
mulation de mutations au cours des générations, induisant
une dégradation progressive des gènes et des séquences
régulatrices de lERV, soit par accumulation de délétions
revue
Virologie, Vol. 14, n
o
2, mars-avril 2010 143
Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017.
ou de recombinaisons, entraînant lélimination ou le
remplacement de séquences internes lERV. Le cas le
plus drastique correspond à une recombinaison homologue
entre les deux LTR dun même ERV éliminant lensemble
des séquences internes et ne laissant subsister quun unique
LTR dans le génome hôte. Ces LTR uniques, nommés
« LTR solo », peuvent être 10 à 100 fois plus fréquents
que les ERV complets [14]. Ces différentes altérations des
ERVau cours de lévolution aboutissent à linhibition de la
capacité de prolifération de ces éléments. Le génome hôte
devient alors un « cimetière » de provirus intégrés non
fonctionnels, continuant de dégénérer au cours du temps,
jusquà devenir difficilement identifiable pour les éléments
les plus anciens.
Dans certains cas cependant, la présence dun ERV peut
être « bénéfique » pour lhôte, par exemple en jouant un
rôle dans certaines fonctions biologiques essentielles.
Dans ce cas, il existe une pression de sélection sur cet
ERV favorisant sa conservation en totalité ou en partie et
augmentant sa fréquence dans la population.
Lhistoire évolutive de lhôte peut également influer sur la
fréquence des ERV présents dans une population. Une
diminution importante de la population hôte peut entraîner,
de façon aléatoire, une surreprésentation de certaines
copies ERV en sélectionnant un sous-groupe dindividus
possédant des ERV différents du reste de la population.
De façon similaire, une augmentation de la population à
partir dun nombre limité dindividus, dits « fondateurs »,
va influer sur la fréquence des ERV retrouvés dans la popu-
lation finale. Ces événements de variation de la taille des
populations sont fréquents au cours de lévolution des
espèces et jouent un rôle important dans les variations de
fréquence alléliques des gènes en général.
Après lintégration dans la lignée germinale dun élément
fondateur, la balance entre lamplification du nombre de
copies de lERVet laccumulation de mutations ou de recom-
binaisons dans certaines copies intégrées au cours du temps
aboutit à la formation dune famille dite « multicopies »
déléments apparentés. Chacune de ces familles correspond
à un événement indépendant de colonisation de la lignée
germinale. Chez lhomme, par exemple, il existe environ
30 000 ERV, dispersés dans lensemble du génome,
regroupés en une cinquantaine de familles monophylé-
tiques contenant chacune entre 1 et 1 000 éléments [15].
Le contenu en ERV de chaque espèce est très variable puis-
quil dépend des épisodes infectieux de ces espèces par
différents rétrovirus mais également de lhistoire évolutive
de ces ERV après leur endogénisation. Lhomme et la
souris, par exemple, pour lesquels le contenu en ERV du
génome a été particulièrement bien détaillé, correspondent
à deux cas différents. Chez lhomme, la quasi-totalité des
ERV identifiés sont non fontionnels [14] alors que chez la
souris, plusieurs éléments sont capables de samplifier dans
le génome. En particulier, près de 10 % des mutations
spontanées observées chez les souris de laboratoire ont
été associées à linsertion dune nouvelle copie dun ERV
dans le génome murin [16].
Amplification des ERV par réinfection
Les ERV peuvent samplifier dans le génome hôte par un
mécanisme de réinfection de la lignée germinale. Lexpres-
sion des gènes dun ERV peut, en effet, aboutir à la produc-
tion de virions infectieux pouvant infecter différentes
cellules de lhôte, notamment les cellules de la lignée
germinale (figure 3). Cela aboutit à une augmentation du
nombre de copies du génome rétroviral intégré dans cette
lignée, et donc transmis à la descendance. Cette infection
peut se faire à partir de virions produits par la lignée germi-
nale elle-même ou par des cellules somatiques environnantes.
Cette amplification ne nécessite pas obligatoirement le
passage du virus entre différents individus. Dans ce type de
cycle de multiplication, impliquant une phase extracellulaire,
RÉ-INFECTION MULTIPLICATION
INTRACELLULAIRE
COMPLÉMENTATION
EN « TRANS »
cellule
somatique
+
cellule de la
lignée germinale
Figure 3. Diversité des modes damplification des rétrovirus
endogènes (ERV).
Lamplification par réinfection de la lignée germinale est possible
grâce à la production par un ERV (en vert) de particules infectieu-
ses. Les virions produits peuvent alors réinfecter les cellules de la
lignée germinale et insérer une nouvelle copie de lERV dans le
génome de lhôte. Des cellules somatiques infectées peuvent
éventuellement être impliquées dans ce processus damplification.
Lamplification par multiplication intracellulaire (ou rétrotransposi-
tion) ne fait pas intervenir de phases extracellulaires. Il nyaen
particulier pas de pression de sélection sur le gène env dans ce
cas. Les nouvelles copies du génome de lERV sont intégrées
directement dans le génome de la cellule productrice. Lamplifica-
tion par complémentation en « trans » dun élément non autonome
(en rouge) requiert lutilisation de la machinerie protéique dautres
éléments mobiles du génome (en vert). Tout comme pour les
éléments autonomes, cette amplification peut se faire soit par
réinfection, soit par rétrotransposition.
revue
144 Virologie, Vol. 14, n
o
2, mars-avril 2010
Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017.
il existe une forte pression de sélection sur lensemble des
gènes de lERV. En effet, laccumulation de mutations
délétères, en particulier dans le gène env, empêche la
prolifération par réinfection de ces éléments.
Il existe plusieurs cas décrits dERV capables de samplifier
par infection. Chez la souris, notamment, plusieurs éléments
fonctionnels ont été isolés et caractérisés, appartenant aux
familles MLV et MMTV endogènes [17], IAPE [18] et
GLN [19]. En règle générale, parmi lensemble des copies
dune famille dERV, seules quelques copies ont la capacité
de samplifier par infection, les autres ayant été inactivées
au cours des générations. Par exemple, pour chacune des
familles IAPE et GLN de souris, seule une copie fonction-
nelle a été identifiée (sur les 250 copies IAPE et les 80
copies GLN respectivement présentes dans le génome de
la souris). Ces deux familles correspondent probablement
à des familles dERV en voie dextinction.
Chez lhomme, aucun HERV (human endogenous retrovirus)
na pour linstant été identifié comme étant capable de
produire des particules virales infectieuses. La famille ayant
montré des traces dactivité la plus récente est la famille
HERV-K(HML-2). En effet, même si cette famille a coloni
le génome des primates il y a plus de 30 millions dannées,
certaines copies HERV-K(HML-2) ne sont retrouvées que
dans une fraction de la population humaine, indiquant quil
existait des copies HERV-K(HML-2) fonctionnelles après la
spéciation de lhomme [20, 21]. Lanalyse du rapport entre
mutations non synonymes et synonymes (dN/dS) des copies
HERV-K(HML-2) du génome humain a de plus permis de
préciser le mode damplification de cette famille déléments
[22]. Si ces éléments se sont amplifiés de façon intracellu-
laire, le rapport dN/dS du gène env serait approximativement
de 1, car il ny aurait pas eu de pression de sélection sur ce
gène non essentiel dans ce type de cycle de multiplication
[22]. De façon similaire, une amplification de ces éléments
par complémentation en trans, en utilisant la machinerie
protéique dune autre famille déléments mobiles, naurait
pas entraîné de pression de sélection sur les gènes gag ou
pol. Le rapport dN/dS des gènes de différentes copies
HERV-K(HML-2) sest avéré être nettement inférieur à 1
et, dans certains cas, proche du rapport dN/dS obtenu pour
des rétrovirus « classiques », révélant ainsi une pression de
sélection dite « purifiante » sur lensemble des gènes,
y compris le gène env [22]. Ces données sont en faveur
dune prolifération de ces éléments par réinfection de la
lignée germinale. Ce type de résultats a été retrouvé pour
huit autres familles dERV chez lhomme.
« Intracellularisation » des ERV
Parallèlement à ce mode damplification par réinfection, les
ERV peuvent samplifier dans le génome de lhôte en
réalisant un cycle strictement intracellulaire aussi appelé
rétrotransposition (figure 3). Contrairement à lamplifica-
tion par réinfection, la rétrotransposition ne nécessite pas
la présence dun gène env fonctionnel. Ce mécanisme
damplification a été détecté à faible fréquence pour des
éléments MLV également capables de se propager par
infection [23]. Létude du rapport dN/dS des gènes de
différents HERV a permis didentifier que certains
éléments, appartenant à la famille HERV-K(HML-3), ont
utilisé ce mode damplification pour coloniser le génome
humain [24]. Chez la souris, deux familles dERV se sont
efficacement amplifiées par rétrotransposition [25, 26].
Ces éléments, les IAP (pour intracisternal A-type particles)
et les MusD (pour Mus musculus type D ERV), sont
responsables de la plupart des cas de mutations spontanées
associées à des ERV identifiés chez la souris [16]. Lexpres-
sion des éléments IAP et MusD est associée à la production
de particules virales restant strictement intracellulaires,
induisant lintégration de nouveaux provirus dans le
noyau de la cellule productrice. Si cette cellule appartient
à la lignée germinale, ce processus permet de coloniser effi-
cacement le génome de lhôte en favorisant la transmission
à la descendance des nouveaux provirus intégrés. Les
éléments IAP et MusD ont la particularité de ne pas
posséder de gène env. Des analyses phylogénétiques basées
sur le gène pol de ces éléments ont cependant permis
de confirmer leur origine rétrovirale [27, 28]. Ils sont en
particulier bien distincts des rétrotransposons à LTR
comme les éléments copia, Ty1 ou Ty3, des éléments
également intracellulaires, dépourvus de gène env, mais
ayant une origine évolutive distincte. Ces éléments MusD
et IAP dérivent de rétrovirus ancestraux ayant subi des
modifications au cours de lévolution aboutissant à leur
transformation en éléments strictement intracellulaires.
Les étapes clés de ces modifications ont été récemment
identifiées. Les éléments MusD sont capables de produire
des particules virales sassemblant dans le cytoplasme mais
qui, contrairement aux particules rétrovirales classiques, ne
sont pas adressées à la membrane plasmique et ne bour-
geonnent pas à lextérieur des cellules. Ces éléments, en
effet, ne possèdent pas de signal dadressage à la membrane
plasmique au début de la protéine Gag. Ce signal, retrouvé
classiquement chez les rétrovirus, consiste en un site
dancrage dun acide myristique suivi par un ensemble de
résidus basiques. Lacide myristique est une longue chaîne
carbonée conférant un pôle hydrophobe à la protéine Gag et
permettant son interaction avec la membrane plasmique.
Les résidus basiques, chargés positivement, interagissent
avec les phospholipides de la membrane plasmique chargés
négativement et stabilisent lassociation de Gag avec la
membrane. Il est important de noter que les rétrovirus
de la famille des spumavirus ne possèdent pas de signaux
de myristylation au niveau de leurs protéines Gag.
revue
Virologie, Vol. 14, n
o
2, mars-avril 2010 145
Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017.
1 / 10 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !