11/12/06 12:42 Page 82 Transposons : des gènes a Des fragments d’ADN vivent en toute indépendance dans le génome. Ce faisant, ils bousculent le fonctionnement des gènes, souvent pour le pire, mais parfois pour le meilleur. D. Anxolabéhère • D. Nouaud • H. Quesneville • S. Ronsseray P lus de deux mètres d’ADN dans chacune de nos cellules. Près de trois milliards de nucléotides, soit autant de lettres A, T, C ou G qui constituent notre patrimoine génétique. Un monde certes vaste, mais que l’on imagine le plus souvent stable, du moins pour un organisme donné : une référence sur laquelle la cellule peut compter en toute occasion pour fabriquer ce dont elle a besoin. Il y a bien quelques mutations deci-delà, au gré des divisions et selon l’environnement, mais rien de bien bouleversant. Erreur, le génome est bien plus « agité » qu’il n’y paraît : des fragments se détachent, se reproduisent, s’insèrent spontanément en d’autres endroits et multiplient les désordres. Ces éléments, nommés transposons ou gènes sauteurs, ont été découverts dans les années 1950 par l’Américaine Barbara McClintock, récompensée par le prix Nobel en 1983. Ces transposons, autoréplicatifs (nous verrons comment) et mobiles, ne sont pas anecdotiques : ils représentent jusqu’à 90 pour cent du génome de certaines espèces, tel le blé, et presque la moitié de notre génome. Ces transposons sont des gènes, en ce sens qu’ils codent des protéines, mais celles-ci ne sont destinées qu’au fonctionnement de l’élément. Lorsqu’ils se déplacent, les transposons peuvent modifier le fonctionnement du génome de leur hôte, par exemple en s’insérant dans une séquence codante ou régulatrice. De plus, les transposons portent eux-mêmes des séquences régulatrices qui interfèrent parfois avec des séquences voisines. Ainsi, après l’insertion d’un transposon, des gènes peuvent adopter de nouveaux profils d’expression temporelle ou spatiale. L’action mutagène des transposons ne se limite pas là. Ils entraînent également des réarrangements chromosomiques de grande ampleur. On convient aujourd’hui que les transposons ont eu un rôle essentiel dans l’évolution de la structure, de la taille et du fonctionnement des génomes, mais ils furent ini- 82 tialement considérés comme des séquences d’ADN égoïste, parasite, ou encore de l’ADN poubelle, c’est-à-dire ayant été mis au rebut au cours de l’évolution. Cette période est révolue et les transposons sont désormais, aux yeux des biologistes, des « semences de l’évolution », car ils accroissent les potentiels évolutifs des organismes au travers de divers mécanismes que nous détaillerons. L’étude des transposons a profondément changé notre vision de nombreux processus génétiques, telles la mutation, la recombinaison, la régulation génique, en un mot l’évolution des génomes. Dans cet article, après avoir décrit l’anatomie d’un transposon et ce que l’on sait de leur évolution, nous présenterons quelques exemples, où les désordres occasionnés seront croissants, illustrant le rôle des transposons dans le remodelage des génomes tant au travers de l’architecture des chromosomes que de l’émergence de nouveautés génétiques. Enfin, nous examinerons comment, chez l’être humain, les transposons participent à diverses maladies génétiques et à certains cancers. Commençons par voir à quoi ressemble un transposon et comment il fonctionne. Parmi tous les organismes, on distingue trois types de transposons répartis en deux classes (voir la figure 1). Différents par leur structure ou leur mécanisme de transposition, 1. Les transposons sont des fragments d’ADN d’une cellule qui se détachent, se multiplient et s’insèrent en d’autres endroits de façon indépendante de l’hôte. Présents chez tous les organismes vivants, on en distingue deux classes. Les événements moléculaires illustrés ici se déroulent dans le noyau (à gauche) ou dans le cytoplasme (à droite). Les transposons de classe I (A) sont des rétrotransposons : dans le noyau, ils sont transcrits (B)en ARN (en violet), lesquels sont traduits, dans le cytoplasme, en protéines (C), par exemple la transcriptase inverse (en bleu); cette dernière copie l’ARN en ADN (D), qui s’insère (E) dans le génome. Les transposons de classe II (F) se dispensent de l’intermédiaire ARN. Dans les deux cas, l’insertion du transposon, par exemple dans un gène (en jaune), peut perturber le fonctionnement de la cellule. Les multiples couleurs de certains épis de maïs (dont le génome contient 50 pour cent de transposons) résultent de tels phénomènes. © POUR LA SCIENCE - N° 351 JANVIER 2007 Toutes les illustrations sont de Virginie Denis 351-ANXOLA.FP.xp 351-ANXOLA.FP.xp 11/12/06 12:42 Page 83 s anarchistes ? F Transposon de classe II Copie du transposon CYTOPLASME Gène perturbé C Insertion de la copie Ribosome A Transposon de classe I NOYAU Transcriptase inverse B ARN polymérase D E ARN Gène perturbé Insertion de la copie Copie du transposon 351-ANXOLA.FP.xp 11/12/06 12:42 Page 84 a ADN Transposon ARN Enzyme transcrit Transcription inverse b Nouvel ADN Copie tronquée Copie entière 2. Les rétrotransposons, tels ceux de la famille LINE 1 (en rose) augmentent la taille des génomes. D’abord, l’élément est transcrit (a) en ARN (en violet). Puis, grâce à une enzyme (en bleu) codée par le transposon, cet ARN subit une transcription inverse (b), c’est-à-dire qu’il est recopié en ADN. Enfin, ce nouvel ADN s’insère dans le génome en un autre site. La copie peut être tronquée, entière, voire plus grande, quand la transcription est allée au-delà des limites du transposon. ADN Transposon LINE 1 ARN Enzyme de LINE 1 Élément Alu ARN a Gène quelconque ARN b Nouvelle copie Pseudogène 3. Les transposons non autonomes, tel l’élément Alu (en orange), sont mobiles grâce aux protéines codées par d’autres transposons, par exemple LINE 1 (en rose) : les nouvelles copies d’Alu insérées augmentent la taille du génome (a). Par ailleurs, l’enzyme de LINE 1 reconnaît n’importe quel ARN messager (en bleu foncé) transcrit d’un gène quelconque (en bleu clair), et peut en faire un pseudogène (un gène inactif), car l’ARN messager n’est pas une copie conforme du gène. Le pseudogène inséré n’importe où augmente la taille du génome (b). a b Transposon Site de recombinaison c Recombinaison normale d Recombinaison aberrante 4. Les recombinaisons inégales. Les transposons, tels ceux de la famille LINE 1 (en rose), entraînent des recombinaisons inégales (les traits discontinus blancs représentent les échanges de matériel génétiques). D’ordinaire, la recombinaison (a)est un échange équilibré de matériel génétique entre deux chromosomes au niveau de sites homologues (en gris): après la recombinaison, les chromosomes ont la même taille (c). Cependant, les transposons, sortes de sites homologues, sont répartis aléatoirement (b) : le matériel échangé n’est plus équivalent (d). 84 ils ont en commun d’être relativement petits (de 1 000 à 20 000 nucléotides) et de coder les protéines nécessaires à la mobilité de l’élément et à son insertion en un nouveau site génomique. Les éléments de classe I sont les rétrotransposons. Ils se déplacent grâce à une enzyme (codée par le transposon) qui copie l’ARN, transcrit de l’ADN du transposon, en un nouvel ADN. Ce dernier phénomène est une transcription inverse. Les éléments nommés LINE (pour Long Interspersed Nuclear Element, soit Long élément nucléaire disséminé) codent une unique enzyme multifonctionnelle qui, outre son activité de transcriptase inverse, reconnaît et coupe l’ADN. Les rétrotransposons à LTR, dotés de longues répétitions terminales (les LTR), codent cinq protéines différentes, dont trois enzymes : la protéase et la transcriptase inverse participent à la réplication de l’élément, tandis que l’intégrase coupe l’ADN au site d’insertion. Ces mécanismes sont similaires à ceux des rétrovirus, tel le VIH, quand ils infectent une cellule. Les éléments de classe II sont les transposons à ADN. Ils se passent de l’intermédiaire ARN et codent une enzyme, une transposase, qui reconnaît les extrémités de l’élément, l’excise et l’insère ailleurs dans le génome. Ce mécanisme de couper-coller conduit parfois à une augmentation du nombre de copies, par exemple quand l’excision se produit après la réplication et l’insertion dans un nouveau site, avant le passage de la fourche de réplication. Chacune de ces classes réunit des éléments plus petits, les SINE (pour Short Interspersed Nuclear Element) et les MITE (pour Miniature Inverted-repeat Transposable Element) dont la taille varie de 100 à 1 000 nucléotides. Non autonomes, ils sont dépourvus de séquence codante et utilisent les protéines codées par d’autres transposons (voir la figure 3). Au regard de l’évolution Le séquençage a révélé que 45 pour cent du génome humain sont constitués de transposons (pour seulement un à deux pour cent de gènes codant des protéines cellulaires). Le plus souvent, seules quelques familles constituent les transposons d’un génome. Ainsi, plus de 20 pour cent de notre génome sont des rétrotransposons de type LINE, et principalement des éléments de la famille LINE 1 (17 pour cent) ; plus de 13 pour cent sont des éléments de type SINE ; enfin, presque 11 pour cent sont des membres de la famille Alu (des petits rétrotransposons non autonomes), qui est aussi la plus représentée en nombre de copies. Comment ces transposons se sont-ils installés ? La signification évolutive des transposons est débattue. Les conséquences le plus souvent négatives sur la survie de leurs hôtes posent le problème de leur maintien au sein des espèces. En effet, sous la pression de la sélection naturelle, les individus avec peu de transposons sont avantagés sur ceux qui en ont beaucoup : on s’attendrait donc à la disparition progressive des transposons. Or on les trouve dans presque tous les organismes (animaux, plantes, champignons, bactéries...), et ce sont les espèces sans transposons qui apparaissent comme des exceptions énigmatiques; c’est le cas de la bactérie Bacillus subtilis. Comment se maintiennent-ils ? Selon une première hypothèse, leur pou- © POUR LA SCIENCE - N° 351 JANVIER 2007 351-ANXOLA.FP.xp 11/12/06 12:42 Page 85 Les nouveautés génétiques Site de fixation Site de fixation g a Domaine de fixation Domaine d’excision Séquence codant le domaine d’excision dégénéré h k i l m j Transposase b Nouveaux gènes codant des protéines dotées d’un domaine de fixation à l’ADN d Site de fixation dégénéré e c U f n transposon de classe II (a) est doté, à ses extrémités, de motifs nucléotidiques reconnus par le domaine de fixation à l’ADN de la transposase qu’il code (en violet), l’enzyme qui assure la migration de l’élément. Une fois la transposase arrimée au transposon, son domaine endonucléasique (en bleu) coupe l’ADN. Au cours de l’évolution, différentes copies d’une même famille de transposons peuvent perdre leur mobilité (b) : les sites de fixation de l’enzyme ne sont alors plus reconnus par la transposase (flèches en pointillés). Cependant, certaines copies conservent leur capacité codante, et même si les sites de fixation ont disparu, l’élément code toujours une transposase (c). En revanche, d’autres sont réduits à un unique motif de fixation (d, e et f). La transposase peut alors réguler les gènes (en jaune) près desquels les copies voir mutagène est une source de variabilité génétique qui, sur le long terme, fait apparaître des mutations avantageuses. Celles-ci compenseraient les effets délétères (mais non létaux) à court terme. Les transposons seraient alors des facteurs évolutifs grâce auxquels les espèces s’adaptent plus rapidement. Cependant, ils pourraient aussi se maintenir grâce à leur pouvoir multiplicatif: ils se multiplieraient plus vite par transposition qu’ils ne sont éliminés par la sélection, dans une sorte de course-poursuite. Plusieurs études sur les populations de transposons ont fourni quelques éclaircissements. La dynamique des transposons On distingue deux modèles de la dynamique des transposons chez les eucaryotes: l’autorégulation et la sélection. Le premier modèle s’applique aux transposons qui contrôlent eux-mêmes leur activité en codant, par exemple, un répresseur. La fréquence de transposition d’une copie est alors inversement proportionnelle au nombre de copies dans le génome de l’individu: plus le nombre de copies est élevé, plus il y a de répresseur fabriqué et moins il y a de transposition. Selon le modèle sélectif, la fréquence de transposition est indépendante du nombre de copies, mais les individus © POUR LA SCIENCE - Biologie Gènes passés sous le contrôle de la transposase d, e et f sont insérées, établissant ainsi un réseau de régulation génique. Autre exemple (g) : dans un transposon, seule la partie codant le domaine de fixation à l’ADN peut rester fonctionnelle. Quand cet élément est inséré dans d’autres gènes (h, i et j), les protéines codées acquièrent ce domaine de fixation à l’ADN. Ces « nouveaux » gènes (k, l et m) peuvent alors constituer une famille de facteurs de transcription. sont sélectionnés en fonction du nombre de copies d’un transposon : plus ce nombre est grand, moins l’individu est viable. Pourquoi ? Une hypothèse stipule que les transposons entraîneraient des recombinaisons inégales conduisant à des chromosomes déséquilibrés, délétères pour l’individu (voir la figure 4). Rappelons que la recombinaison a lieu au moment de la formation des gamètes : elle se traduit par l’échange de matériel génétique entre deux chromosomes d’une même paire, qui se « cassent » aux mêmes endroits (dits homologues) et intervertissent les fragments (de même longueur) obtenus. Or les transposons joueraient le rôle de « sites homologues » : répartis aléatoirement dans le génome, le matériel génétique échangé lors de la recombinaison ne serait pas équivalent d’un chromosome à l’autre. Un individu dont le génome est riche en transposons aurait plus de chances de produire des gamètes porteurs d’accidents chromosomiques et, en conséquence, d’avoir une fertilité diminuée. La réalité est probablement une combinaison de plusieurs mécanismes, les deux modèles précédents ne s’excluant pas. L’invasion des transposons se décompose en deux phases. La première est l’invasion rapide de l’espèce avant que des mécanismes de répression (autorégulation et sélection) ne freinent cette invasion. Suit alors la seconde phase, celle de dégénérescence : le transposon accumule des mutations jusqu’à « disparaître » du génome (il est 85 351-ANXOLA.FP.xp 11/12/06 12:42 Page 86 devenu méconnaissable et ne fonctionne plus). Le salut du transposon peut venir d’un événement dont les modalités restent mystérieuses : le passage dans une autre espèce, où son cycle d’invasion recommence. Ainsi, une même espèce peut subir des invasions successives, voire simultanées, de différentes familles de transposons venus d’ailleurs. Quelles en sont les conséquences dans le génome? Les réarrangements génomiques Plusieurs mécanismes de réarrangements génomiques ont été identifiés. Le premier concerne les rétrotransposons, et notamment les éléments de type LINE. Leur transcription en ARN, la première étape de sa migration, s’arrête parfois au-delà de l’élément : la séquence génomique aval est transcrite en continuité avec celle du transposon, faisant la copie plus longue que l’original (voir la figure 2). Nous avons vu que les copies dispersées d’un transposon pouvaient donner lieu à des recombinaisons inégales et des chromosomes aberrants. La sélection naturelle participe à l’élimination de ces éléments, c’est le modèle sélectif, mais certains événements de recombinaison échappent à la pression quand le matériel remanié ne perturbe pas l’intégrité du génome : au final, les chromosomes sont remaniés de façon durable. Autre désordre, les éléments de classe II créent parfois, à cause de leur mode de transposition, des macrotransposons constitués de deux éléments de la même famille et de la région génomique qu’ils encadrent. La transposition utilise l’extrémité droite d’une des copies et l’extrémité gauche de l’autre comme s’ils étaient les extrémités d’une même copie. L’ensemble s’excise et s’insère comme un seul transposon, déplaçant une fraction non négligeable du génome. Les rétrotransposons à LTR auraient un effet plus notable sur la taille des génomes que les autres types d’éléments. Pour quelles raisons ? D’abord, ce sont de grands éléments ; aussi, lorsqu’ils se multiplient, augmententils plus vite la taille des génomes que les petits transposons. Cependant, les structures répétées de leurs extrémités (les LTR) jouent un rôle antagoniste. En effet, ces deux séquences sont la cible de recombinaisons inégales, ce qui élimine d’un coup la séquence qu’elles encadrent. Ce phénomène peut aussi avoir lieu entre copies et ainsi retirer des portions génomiques importantes. Outre ces réductions massives et soudaines, de petites délétions de quelques dizaines de paires de nucléotides se produisent continuellement dans le génome. Elles sont le résultat de cassures, spontanées et aléatoires, de l’ADN, qui sont mal réparées par l’hôte. Lorsqu’elles ont lieu dans des séquences non essentielles à la survie de l’hôte ou dans des transposons, ces coupures participent à la diminution de la taille des génomes. Ce processus d’érosion joue également un rôle dans l’élimination des transposons. L’examen du génome révèle que les régions riches en transposons sont celles où la recombinaison est moins fréquente, c’est-à-dire celles où le processus d’élimination décrit précédemment est moins fréquent, les transposons pouvant donc s’accumuler. La densité en gènes d’une région influe aussi sur la densité en transposons. En effet, dans 86 ces régions à haute densité, les insertions et les éliminations ont plus de chances de perturber les gènes voisins : la pression de sélection qui maintient fonctionnels ces gènes laissera la région pauvre en transposons. Ces exemples de bouleversements montrent que les transposons jouent un rôle majeur dans les processus évolutifs en tant que source de nouveauté génétique. Ils ont aussi des acteurs de la spéciation, c’est-à-dire de l’apparition d’espèces nouvelles à partir d’une population homogène. Trois mécanismes ont été proposés. Le premier est fondé sur une modification majeure des programmes de développement des individus. Nous avons vu que les transposons modifient parfois l’expression des gènes : de tels changements qui rallongeraient la période de maturité sexuelle de certains individus créeraient un isolement reproductif, les individus à courte période de maturité sexuelle s’accouplant ensemble. Selon le deuxième mécanisme, les remaniements chromosomiques dus aux transposons empêcheraient l’appariement des chromosomes homologues chez les hybrides, conduisant là aussi à un isolement reproductif : seuls les individus au profil chromosomique identique seraient féconds. Enfin le dernier mécanisme concerne des familles de transposons entraînant une dysgénésie des hybrides, par exemple chez la drosophile. Ces dysgénésies sont des incompatibilités de croisements entre des mâles porteurs d’une famille de transposons et des femelles qui en sont dépourvues : la descendance est stérile en raison de multiples remaniements chromosomiques. Ces croisements déclenchent aussi une ségrégation au sein d’une population. Les effets des transposons que nous avons vus laissent croire que l’hôte est passif devant cette invasion. Ce n’est pas toujours le cas. Le palimpseste génomique Le manuscrit génomique est réécrit en permanence. La comparaison des génomes montre qu’au cours de l’évolution, les transposons ont notablement contribué à cette réécriture. En effet, ils codent des protéines qui représentent pour la cellule un répertoire attractif de nouvelles propriétés. De plus certaines de ces protéines modifient ou détournent la fonction originelle de molécules de l’hôte. Ce dernier, en maîtrisant le comportement « anarchique » des transposons, c’est-à-dire en détournant certaines propriétés de leurs protéines à son profit, bénéficie d’innovations à bon compte. Voyons comment (voir l’encadré de la page 85). Plusieurs études ont montré que des transposons de classe II et les transposases qu’ils codent ont été une source de domaines protéiques pour l’assemblage de nouveaux gènes au cours de l’évolution. Au cours de l’évolution, la séquence codant un domaine de fixation à l’ADN d’une transposase peut subir des remaniements et être insérée dans d’autres gènes, on parle de brassage d’exons. Les protéines codées par ces gènes « dopés » peuvent constituer, par exemple, une famille de facteurs de transcription. Ainsi, le domaine BED est un domaine de fixation à l’ADN qui est trouvé à la fois dans plusieurs transposases et dans plusieurs protéines qui assurent des fonctions cellulaires associées à l’ADN. © POUR LA SCIENCE - N° 351 JANVIER 2007 351-ANXOLA.FP.xp 11/12/06 12:42 Page 87 Chromatine et ARN ARN 1 Transposon 1 Transposon 2 ARN 2 DICER Hétérochromatine ARN double brin RITS L es transposons seraient à l’origine de la formation d’hétérochromatine, une forme compacte de l’ADN. Selon un modèle récent, des transposons insérés selon des orientations opposées peuvent conduire à la production d’ARN double brin. Ce dernier suit la voie de l’interférence à ARN, un mécanisme de contrôle des gènes : l’ARN double brin est découpé par l’enzyme DICER en petits fragments qui sont pris en charge par le complexe RITS. Dans le noyau, cet assemblage s’associe à l’ADN au niveau des deux transposons (leur séquence est complé- Les transposons peuvent également participer à l’émergence d’un réseau de gènes coordonnés, un phénomène qui requiert des mécanismes de réorganisation rapide et à grande échelle de diverses séquences. Par exemple, différentes copies d’une même famille de transposons peuvent être altérées et perdre leur mobilité. Imaginons que l’une de ces copies soit néanmoins suffisamment conservée pour coder une transposase entière, alors que d’autres copies sont réduites à un seul motif de fixation reconnue par la transposase. Quand ces dernières copies sont insérées près de gènes, la transposase devient le régulateur de leur expression : par exemple, elle empêche la fabrication des protéines codées en favorisant la formation d’hétérochromatine (nous y reviendrons). Ainsi, c’est un réseau de régulation génique qui est établi. La domestication des transposons Récemment, ce scénario a été confirmé chez l’arabette des dames (Arabidopsis thaliana). En effet, le gène Daysleeper, essentiel au développement de la plante, code un facteur de transcription qui partage plusieurs caractéristiques avec les transposases des transposons de la famille hAT. Ce facteur de transcription se fixe, d’une part, à un motif nucléotidique présent dans la région régulatrice d’un gène (Ku70) de réparation des cassures d’ADN et, d’autre part, dans la région régulatrice de nombreux autres gènes de la plante. Les plantes mutées pour Daysleeper souffrent de graves anomalies de développement, tandis que sa surexpression entraîne une dérégulation de l’expression de nombreux gènes. Le gène Daysleeper s’est probablement différencié à partir d’une copie d’un transposon hAT immobilisée il y a plusieurs millions d’années et a acquis une fonction cellulaire essentielle. © POUR LA SCIENCE - Biologie mentaire du fragment d’ARN porté par RITS) et déclenche la formation d’hétérochromatine. L’ADN s’enroule autour de protéines histones (en jaune) recrutées. De nombreuses régions d’hétérochromatine seraient maintenues dans cet état par l’interférence à ARN. Un autre exemple spectaculaire de domestication de transposons est une fonction clé du système immunitaire des vertébrés qui a émergé il y a environ 100 millions d’années à partir d’un transposon. Dans ce système, deux protéines, RAG1 et RAG2, sont essentielles à la diversité des anticorps, des protéines constituées de trois fragments nommés V, D et J : à partir d’un répertoire étendu pour chacune de ces parties, l’organisme dispose d’un nombre élevé de combinaisons afin de faire face à tout intrus. Les protéines RAG 1 et RAG 2 reconnaissent des séquences nucléotidiques spécifiques au voisinage des segments V, D et J des gènes des anticorps et coupent l’ADN immédiatement à proximité de ces séquences, celles-ci ressemblant aux extrémités de nombreux transposons. La similitude de structure, confortée par des points communs fonctionnels, indique que les gènes RAG1 et RAG2 étaient autrefois des parties d’un transposon actif. Les recrutements de séquences dérivées de transposons ne sont certainement pas que de simples incidents sporadiques. Jusqu’à présent, de tels événements bénéfiques pour l’hôte ont été découverts par hasard. Une recherche systématique révélerait sans doute que les transposons jouent un rôle d’intégrateur dans l’évolution des génomes eucaryotes. Les modifications du génome dues aux transposons ne se limitent pas à sa séquence en acides nucléiques, même si les changements, on l’a vu, sont parfois de grande ampleur. En effet, les transposons influent également sur la structure tridimensionnelle du génome et donc sur l’accessibilité des gènes. Cette structure, nommée chromatine, est déterminée par des protéines, telles des histones, associées à l’ADN. Certaines régions de la chromatine sont compactes, on parle d’hétérochromatine, et le génome y est réduit au silence. D’autres secteurs sont plus lâches et donc plus accessibles, c’est l’euchromatine. Les chromosomes sont structurés quant à la distribution des deux types de chromatine : les parties 87 351-ANXOLA.FP.xp 12/12/06 11:26 Page 88 Télomère Euchromatine Transposon ARN transcrit NOYAU Nouvelle copie du transposon Transcription inverse CYTOPLASME 5. Les télomères des chromosomes de dro- sophile contiennent trois familles de rétrotransposons de type LINE , celles-ci étant absentes de l’euchromatine. Ces rétrotransposons ne s’insèrent qu’aux télomères et compensent l’érosion que ces derniers subissent au cours des générations successives. Ces éléments sont insérés en tandem, avec la même orientation, et constituent des séquences de 20 000 à 100 000 nucléotides selon les télomères. Une région sous forme d’hétérochromatine constituée de motifs non codants (en vert) sépare les télomères de l’euchromatine. centrales et terminales (les centromères et les télomères) sont hétérochromatiques tandis que les régions intermédiaires sont surtout euchromatiques, même si l’on y trouve des îlots d’hétérochromatine. L’euchromatine est riche en gènes, tandis que l’hétérochromatine, pauvre en gènes, est principalement constituée de transposons. Comment expliquer cette corrélation entre la structure chromatinienne et la densité en transposons ? L’hétérochromatine « attire »-t-elle les transposons ou l’insertion de transposons dans une région euchromatique entraîne-t-elle son évolution vers un état hétérochromatique ? Le rôle de l’ARN Les premières études de l’hétérochromatine ont porté sur les centromères. La comparaison, chez le chromosome 2 de la drosophile, d’une région d’euchromatine avec une autre de l’hétérochromatine du centromère révèle que la densité en transposons est notablement supérieure dans cette dernière région. L’analyse plus précise montre que la plupart des transposons centromériques sont incomplets et ont une séquence dégénérée. À l’inverse, les transposons de l’euchromatine correspondent souvent à des copies intactes et fonctionnelles. La structure de certains îlots d’hétérochromatine révèle un mécanisme de sa formation. Une région euchromatique du bras long du chromosome 4 d’Arabidopsis thaliana a été dupliquée et insérée à proximité du centromère sur l’autre bras. Cette région a ensuite subi une inversion, puis a évolué vers une structure hétérochromatique, nommée Knob. 88 Ribosome Les transposons se sont plus accumulés dans la région dupliquée hétérochromatique que dans la région d’origine. Cependant l’ordre des gènes et leur orientation sont restés les mêmes: le changement de statut chromatinien de cette région génomique, corrélé à l’enrichissement en transposons, est certainement la conséquence de cet enrichissement. Un modèle qui rend compte de cette hétérochromatinisation locale associée à la présence des transposons a été proposé après la découverte en 2002 d’un lien entre la formation d’hétérochromatine et l’interférence à ARN, un phénomène de répression des gènes. Détaillons ce modèle (voir l’encadré de la page 87). Des transposons proches et insérés en orientations opposées sont transcrits, chacun en un ARN complémentaire de l’autre. Ils s’assemblent donc en un ARN double brin qui est coupé en fragments de 20 à 30 paires de nucléotides. Ces petits ARN sont transportés par un complexe protéique jusqu’à une région génomique (celle des transposons d’origine) dont la séquence est complémentaire de celle de ces petits ARN. Là, le complexe entraîne, par des mécanismes encore inconnus, un changement de structure de la chromatine en hétérochromatine. La production d’ARN double brin homologue à une région génomique a déclenché un phénomène d’hétérochromatinisation de cette région. Les transposons ont donc un rôle sur la structuration de la chromatine en formant des régions hétérochromatiques autour de leur point d’insertion. Les transposons ont un autre effet sur la structuration du génome. En effet, certains d’entre eux, tel le rétrotransposon Gypsy de la drosophile, portent des séquences, dites « insulatrices », dotées de deux propriétés principales : © POUR LA SCIENCE - N° 351 JANVIER 2007 351-ANXOLA.FP.xp 11/12/06 12:42 Page 89 une activité « bloqueur » lorsque le transposon est inséré entre un promoteur et son activateur ; un effet « barrière » quand un transposon à la frontière d’une région hétérochromatique empêche la progression de l’hétérochromatine le long du chromosome. Les transposons ont à la fois une fonction génératrice de l’hétérochromatine, mais aussi inhibitrice dans certains secteurs génomiques : ils assurent ainsi une partition du génome en instaurant des frontières entre l’hétérochromatine et l’euchromatine. Les télomères (les extrémités des chromosomes) de la drosophile constituent un autre exemple d’une fonction essentielle assurée par les transposons au sein des génomes (voir la figure 5). Les télomères raccourcissent à chaque division cellulaire en raison du mécanisme de réplication de l’ADN qui ne peut copier la portion terminale des chromosomes (environ 70 paires de nucléotides sont éliminées à chaque cycle). De nombreux organismes compensent cette érosion grâce à une enzyme, une télomérase, qui, dans la lignée germinale, ajoute des courts motifs répétés en tandem à l’extrémité des chromosomes afin de maintenir l’intégrité du génome au cours des générations. La drosophile a « mis au point » une solution originale pour cette maintenance. En effet, cet insecte est dépourvu de télomérase, mais a trois familles de transposons de classe I dont la transposition est spécifiquement orientée vers les télomères. Ce sont donc ces transposons qui subissent le grignotage nucléotidique à chaque cycle de division cellulaire, l'extrémité des chromosomes étant préservée. Les transposons, que l’on a « accusé » d’être de l’ADN égoïste, sont ici un ADN héroïque qui ne se localise qu’à l’endroit le plus dangereux du génome. Transposons, maladies et thérapies Les transposons portent un génome minimal finement organisé pour leur propre réplication dans un environnement génomique étranger. Les régions régulatrices à l’intérieur des éléments orchestrent les rythmes et les modalités de leur expression tandis que des protéines codées par les éléments eux-mêmes dirigent leur propagation à l’intérieur du génome. En raison de leur nature « anarchiste », ils ont souvent des effets délétères sur leur hôte et, par là même, réduisent aussi leur propre valeur adaptative. Mais puisque les transposons sont universels, ils doivent avoir acquis une stratégie efficace leur permettant de coexister avec leurs hôtes sans être trop fortement contre-sélectionnés. Ils représentent in fine une force créative majeure pour l’évolution des gènes et des génomes. Nous connaissons peu de choses sur l’origine des transposons. Cependant, on peut supposer que leur trace remonte à la transition d’un hypothétique génome ARN vers un génome ADN. Ces génomes primordiaux étaient des collections d’éléments d’ARN ou d’ADN autonomes, équivalents à des transposons. Selon ce scénario, les génomes modernes doivent avoir évolué par le recrutement de transposons en tant que « bâtisseurs » de génomes en commençant avec des éléments de type rétrotransposons. En remontant suffisamment loin, la distinction entre génome de l’hôte et les éléments génomiques égoïstes devient obsolète. La domestication moléculaire de transposons présents dans les génomes « modernes » est la continuité d’un même processus évolutif qui avait déjà lieu dans les génomes « primitifs ». Dominique ANXOLABÉHÈRE est professeur émérite à l’Université Pierre et Marie Curie. Il dirige l’équipe Dynamique du génome et évolution, à l’Institut Jacques Monod, à Paris (CNRS-Universités Paris VI et Paris VII), où Stéphane RONSSERAY et Danielle NOUAUD travaillent. Hadi QUESNEVILLE dirige l’équipe Bio-informatique et génomique au sein du même Institut. Z. IVICS et al., Transposons for gene therapy !, in Current Gene Therapy, vol. 6(5), pp. 593-607, 2006. C. BERGMAN et al., Recurrent insertion and duplication generate networks of transposable element sequences in the Drosophila melanogaster genome, in Genome Biology, vol. 7(11), pp. R112, 2006. E. BERNSTEIN et al., RNA meets chromatin, in Genes Dev., vol. 19 (14), pp. 1635-1655, 2005. & Bibliographie © POUR LA SCIENCE - Biologie Du primitif au moderne Auteurs Depuis 20 ans, on sait que les transposons entraînent des maladies génétiques en raison de leur activité mutagène. Ainsi, on connaît trois cas d’hémophilie de type A associés à des insertions indépendantes de transposons de la famille LINE 1 dans le gène codant le facteur VIII, une protéine nécessaire à la coagulation du sang. De même, quatre insertions indépendantes d’un transposon LINE 1 sont à l’origine de dystrophies musculaires, de cardiopathies, de bêta-thalassémies (une anomalie de l’hémoglobine) ou de rétinite pigmentaire. Ces maladies héréditaires témoignent de l’activité mutagène des transposons dans la lignée germinale. En outre, leur mobilité dans les autres cellules (les cellules somatiques) participe à l’apparition de cancers. Ainsi, une insertion de novo d’un transposon LINE 1 dans le gène suppresseur de tumeur APC ou dans le proto-oncogène c-myc est incriminée respectivement dans un cancer du côlon et dans un cancer du sein. En retour, des transposons peuvent être utilisés en thérapie génique. Des séquences rétrovirales dépourvues de leur pouvoir pathogène sont utilisées pour construire des vecteurs de gènes destinés à suppléer le gène défaillant. Après insertion dans le génome du patient atteint de maladie génétique, le vecteur doit s’exprimer de façon stable et autonome. Le principal obstacle à cette thérapie est que le site d’insertion du vecteur reste incontrôlé et est souvent sources de perturbations du génome parfois plus graves que celle que le vecteur est censé corriger. Pour pallier cet inconvénient, les biologistes étudient des vecteurs pour lesquels ils pourraient « choisir » les sites d’insertion ou, à tout le moins, dont les sites d’insertion seraient préférentiellement situés dans des régions intergéniques. Les rétrotransposons LINE et les transposons de type II semblent, de ce point de vue, prometteurs. En effet, par génie génétique, on a construit une transposase nommée mariner active à partir de la séquence consensus déduite des éléments mariner inactifs présents dans le génome du saumon. L’efficacité de cet élément ressuscité, nommé Spleeping Beauty, dans les cellules humaines en culture ainsi que sa stabilité en font un vecteur potentiel de thérapie génique plus sûr que les vecteurs rétroviraux. 89