296 - SCHWEIGHOFFER 03/05 14/05/02 12:41 Page 44 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER: Un même gène pour plusieurs protéines FABIEN SCHWEIGHOFFER Au cours de l’évolution, les mécanismes de la synthèse des protéines se sont dotés d’un moyen d’offrir aux cellules une diversité quasi infinie de protéines à partir d’un nombre limité de gènes : l’épissage alternatif. ’être humain et le chimpanzé, son plus proche cousin, ont en commun 98,7 pour cent de leurs gènes. La différence suffit-elle à expliquer leurs dissemblances tant morphologiques que comportementales et cognitives? L’équipe de Svante Pääbo, de l’Institut Max Planck, à Leipzig, en Allemagne, a montré que la distinction résulte surtout de variations dans l’expression des gènes selon les organes: très similaires dans des organes, tel le foie, ou dans le sang, la quantité de protéines fabriquées par le cerveau humain est notablement supérieure à celle que présente le cerveau des autres primates. Nous devrions notre «supériorité» à une expression génétique plus intense dans notre cerveau. Ainsi, les génomes diffèrent peu, mais la façon dont les cellules les utilisent varie, et ce, grâce à un mécanisme élaboré, la synthèse protéique. Celle-ci consiste d’abord à transcrire les gènes de l’ADN en ARN prémessagers, puis, après un processus de maturation nommé épissage, à traduire ces ARN devenus messagers en protéines. Ce mécanisme participe à la diversité du monde vivant et a joué un rôle dans l’apparition de l’être humain; de nombreux acteurs le contrôlent et le guident dans l’accomplissement de sa tâche. Si la transcription participe à la différence entre l’être humain et les autres primates, la seconde étape de la synthèse protéique, l’épissage, a joué un rôle dans la «supériorité» des mammifères par rapport aux autres animaux. En effet, un dogme de la génétique voulait que le nombre de gènes diffère peu de celui des protéines fabriquées par les cellules. Or, le dogme est tombé. En 2001, deux organisations rivales ont séquencé le génome humain. Le résultat est sans appel, et confirme ce que des études préalables avaient montré : le génome humain est constitué de 30 000 à 40 000 gènes seulement, à peine trois fois plus qu’une mouche (14 000 gènes). Passée la surprise, il convenait d’expliquer comment la complexité et surtout la diversité d’organisation des tissus des mammifères s’accommodent d’un nombre de gènes relativement proche de celui d’organismes moins évolués. Un élément de réponse est apporté par la confrontation des informations issues des programmes de séquençage des génomes avec les résultats des séquençages d’ARN messagers : chez l’homme, le nombre d’ARN messagers est L 44 supérieur à 100 000, soit environ trois fois plus que de gènes. Ainsi chaque gène donne quelque trois ARN, chacun donnant une protéine différente. On commence à entrevoir d’où vient la différence entre la drosophile et l’homme! C’est précisément ce que nous allons examiner. Après avoir décrit les étapes qui mènent d’un gène à une protéine, nous détaillerons les mécanismes et les rôles de l’épissage, dont nous verrons qu’il existe un épissage constitutif – la maturation proprement dite – et un épissage alternatif, à l’origine de la diversité des ARN messagers produits à partir d’un même gène, puis les conséquences pathologiques des dysfonctionnements de cet épissage alternatif. Enfin, nous examinerons pourquoi les biologistes fondent beaucoup d’espoir sur l’épissage alternatif pour élucider le fonctionnement des cellules et pour mettre au point de nouveaux médicaments. Du gène aux ARN et de l’ARN aux protéines Ainsi, au cours de l’évolution, une stratégie a été sélectionnée qui autorise la production de plusieurs ARN messagers et, par conséquent, de plusieurs protéines, à partir d’un seul gène : il s’agit de l’épissage, l’une des étapes clefs de l’expression génétique. Les ARN prémessagers, copiés de l’ADN, sont une succession de régions codantes, les exons, qui sont traduites en protéines, et de régions non codantes, les introns. L’épissage constitutif consiste à éliminer ces derniers et à juxtaposer les exons pour former un ARN messager mature qui est ensuite traduit en une protéine par les ribosomes. L’épissage alternatif multiplie les résultats de cette maturation. En effet, tous les exons ne sont pas retenus pour former l’ARN messager mature: pour au moins 60 pour cent des gènes humains, l’épissage alternatif se superpose à l’épissage 1. UNE CELLULE contient entre 30 000 et 40 000 gènes. Cependant, elle fabrique au moins trois fois plus de protéines. L’ARN polymérase copie le gène en un ARN prémessager composé d’exons codants et d’introns non codants qui sont éliminés durant l’épissage constitutif. Selon le contexte cellulaire, certains exons sont conservés, d’autres sont éliminés et les exons restants sont juxtaposés : c’est l’épissage alternatif. Au final, selon l’ARN messager obtenu, un même gène code plusieurs protéines. © POUR LA SCIENCE - N° 296 JUIN 2002 296 - SCHWEIGHOFFER 03/05 14/05/02 12:41 Page 45 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER: NOYAU ARN POLYMÉRASE PORE NUCLÉAIRE ADN ARN PRÉMESSAGER ÉPISSAGE ALTERNATIF INTRON EXCISÉ ARN MESSAGER 2 ARN MESSAGER 1 CYTOPLASME PROTÉINE 2 Delphine Bailly RIBOSOME PROTÉINE 1 296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 46 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER: ARN POLYMÉRASE 1 2 ARN PRÉMESSAGER 3 INTRON ÉLIMINÉ 4 ARN MESSAGER MATURE constitutif et, selon le contexte cellulaire, ajoute ou retire un exon pour former l’ARN messager mature. Les multiples protéines fabriquées à partir de ces ARN messagers sont des isoformes protéiques. Dans telle cellule, un gène donné code une protéine, alors que dans une autre cellule, ou dans la même à un moment différent, le même gène code une autre protéine, différant de la première par une portion de sa séquence en acides aminés. Ces deux protéines peuvent avoir des fonctions différentes. Par exemple, de nombreuses cellules sécrètent de la fibronectine, une protéine adhésive. Cependant, celle des fibroblastes est dotée de domaines protéiques grâce auxquels elle se fixe aux cellules, alors que celle des cellules du foie est dépourvue de ces domaines et qu’elle est transportée par le sang. Un destin de protéine 5 6 RIBOSOME 7 PROTÉINE Le génome, c’est-à-dire le répertoire des gènes d’un organisme dont le support est l’ADN, donne naissance, via la transcription, à un répertoire constitué d’ARN nommé transcriptome. L’ADN est un polymère de nucléotides (voir la figure 3), des molécules constituées d’acide phosphorique, d’un sucre, le désoxyribose, et d’une molécule nommée base azotée dont les quatre principales sont l’adénine, la thymine, la cytosine et la guanine. L’adénine et la guanine, dérivées de la purine, sont des bases puriques ; la thymine et la cytosine sont des bases pyrimidiques. La protéine est codée par les bases. L’ARN diffère par la nature du sucre, le ribose, de ses nucléotides, et par une base pyrimidique, l’uracile, qui remplace la thymine. L’ADN et l’ARN sont deux acides nucléiques orientés : dans un nucléotide, l’acide phosphorique est lié à l’atome de carbone numéroté 5' de la molécule de sucre. Les nucléotides s’associent par des liaisons ester de l’acide phosphorique d’un nucléotide à l’atome de carbone 3' du sucre du nucléotide suivant. Ainsi, un brin d’ADN (ou un brin d’ARN) a une extrémité 5' et une extrémité 3'. Le transcriptome est composé de deux catégories d’ARN : les précurseurs 2. LA SYNTHÈSE DES PROTÉINES. Dans le noyau d’une cellule, un gène (1) est transcrit par une enzyme, l’ARN polymérase, en un ARN prémessager (2), qui est une succession (3) d’exons codants et d’introns non codants. Lors de l’épissage (4), les introns sont éliminés et les exons juxtaposés dans l’ARN messager mature (5). Celui-ci sort du noyau et est traduit par les ribosomes (6) en une protéine (7). 46 des ARN messagers, ou ARN prémessagers, et les ARN messagers matures. Les ARN prémessagers sont des copies quasi conformes des gènes. Ce sont plus exactement des copies «en négatif» de l’ADN, en raison des lois d’appariement des bases complémentaires. En effet, lors de la synthèse protéique (voir la figure 2), une enzyme, l’ARN polymérase, parcourt le gène et fabrique peu à peu l’ARN prémessager en respectant les règles d’appariement qui résultent de la structure des bases azotées : aux bases adénine, thymine, cytosine et guanine de l’ADN correspondent respectivement les bases uracile, adénine, guanine et cytosine de l’ ARN . Puis l’ ARN prémessager est transformé en un ARN messager lors de l’épissage : l’épissage constitutif enlève seulement les introns, alors que l’épissage alternatif ôte parfois un ou plusieurs exons. Ainsi, certains gènes donnent naissance à plusieurs versions d’ARN messagers matures, distincts par un ou plusieurs exons, à l’origine de plusieurs protéines différentes. Par exemple, le gène neurexin (voir la figure 4), qui code des protéines participant à la formation des synapses, peut être à l’origine de plus de 2 000 ARN messagers matures différents. Le nombre de protéines différentes codées par un même gène atteint parfois plusieurs dizaines de milliers. Le dogme «un gène, une protéine» a vécu ! À l’instar de la transcription, où, par exemple, une séquence d’ADN nommée promoteur indique où l’ARN polymérase se fixe, l’épissage est commandé par des séquences d’ARN, présentes dans les ARN prémessagers, et par de nombreux édifices moléculaires composés d’ARN et de protéines. Les premiers indiquent aux seconds où ils doivent se fixer. On dit que les premiers agissent en cis (de l’intérieur de l’ARN prémessager), alors que les seconds agissent en trans (de l’extérieur). Certaines séquences cis sont présentes aux jonctions entre les exons et les introns, d’autres, nommées silenceurs ou activateurs, influent à distance sur l’épissage. Nous verrons que ces séquences qui agissent à distance participent plus particulièrement à l’épissage alternatif, alors que les séquences qui marquent les extrémités des exons et des introns interviennent dans les deux types d’épissages. Ces dernières séquences © POUR LA SCIENCE - N° 296 JUIN 2002 296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 47 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER: EXON 1 SÉQUENCE DE BRANCHEMENT EXTRÉMITÉ 5' DE L'INTRON 5' GU EXTRÉMITÉ 3' DE L'EXON A INTRON EXTRÉMITÉ 3' DE L'INTRON Pyr. ENCHAÎNEMENT DE BASES PYRIMIDIQUES BASE PURIQUE 3. L’ARN PRÉMESSAGER est une succession de nucléotides (ci-contre), composés d’une base azotée purique (adénine ou guanine) ou pyrimidique (uracile ou cytosine), d’un sucre, le ribose, et d’acide phosphorique qui les relie entre eux selon une direction 5’ vers 3’. Cet enchaînement constitue une succession d’exons (ci-dessus, en vert) et d’introns (en rouge). On distingue plusieurs régions qui participent à l’épissage : les jonctions entre les exons et les introns, où la guanine (G) et l’uracile (U) marquent le début des introns (extrémité 5’) ; les jonctions entre les introns et les exons où l’adénine (A) et la guanine (G) indiquent la fin des introns (extréATOME 5' SUCRE mité 3’) ; enfin, dans chaque intron, une séquence de branchement, DU SUCRE reconnue par les molécules participant à l’épissage et qui contient toujours une adénine (A) et un enchaînement de bases pyrimidiques (Pyr). Par ailleurs, les exons contiennent aussi des séquences activatrices de l’épissage. sont bien conservées à travers le règne vivant et on les représente par des séquences consensus où apparaissent les bases communes : par exemple, un intron commence toujours par une guanine et un uracile. En revanche, les séquences des silenceurs et des activateurs varient notablement et on ne les identifie qu’au cas par cas. La maturation des ARN prémessagers met en jeu cinq petites particules ribonucléoprotéiques nucléaires (PRNpn), composées d’ARN et de protéines, nommées U1, U2, U4, U5 et U6, qui fonctionnent en synergie avec un grand nombre d’autres protéines. Ces complexes reconnaissent sur les ARN prémessagers plusieurs endroits (voir la figure 3) : l’extrémité 5’ des introns, constituée de quatre bases ; une séquence de branchement, d’environ dix bases, et un enchaînement de 14 bases pyrimidiques, la cytosine et l’uracile, proches de l’extrémité 3’ (cet enchaînement est parfois ponctué de quelques bases puriques) ; enfin, l’extrémité 3’ elle-même, longue de quatre bases, qui marque la fin de l’intron. Les intermédiaires de l’assemblage des différents complexes sur les ARN prémessagers ont été mis en évidence et ont révélé les étapes de l’épissage (voir l’encadré de la page 48). Peu à peu, des molécules, dont les PRNpn U1, U2, U4, U5 et U6, mais aussi des protéines nommées SR , dotées d’un domaine dit SR riche en acides aminés sérine et arginine, se lient à l’ARN prémessager, le replient, puis éliminent les introns. Cette succession d’événements est le © POUR LA SCIENCE - N° 296 JUIN 2002 propre de l’épissage constitutif. Comment devient-il alternatif? Les protéines du destin Dans certains cas (voir l’encadré de la page 49), notamment quand la séquence de bases pyrimidiques est interrompue par des bases puriques, la reconnaissance d’un site d’épissage requiert la fixation de protéines SR sur des séquences activatrices d’épissage situées dans les exons. Or, ces séquences sont aussi la cible d’autres protéines, telles les protéines PRNhn A1 qui influent sur l’épissage : selon que les protéines SR sont plus (ou moins) abondantes dans le noyau que les protéines PRNhn A1, un seul intron ou un exon flanqué de deux introns, est éliminé. La compétition entre les protéines à domaine SR et les protéines PRNhn A1 est ainsi le facteur essentiel de l’épissage alternatif. En amont, le fonctionnement de ces protéines, et, par conséquent, l’épissage alternatif lui-même, est commandé par les différents chemins de signalisation cellulaire où une molécule messagère extracellulaire, entraîne, par sa fixation à un récepteur membranaire, une cascade de réactions intracellulaires. Les chemins de signalisation cellulaire modifient notamment la phosphorylation (la fixation de groupes acides phosphoriques) des protéines SR et des protéines PRNhn. Par exemple, la phosphorylation des protéines PRNhn A1 entraîne leur reconnaissance par des protéines du cytoplasme qui les empêchent de pénétrer dans le noyau où les pro- SÉQUENCE ACTIVATRICE DE L'ÉPISSAGE 3' AG EXTRÉMITÉ 5' DE L'EXON 2 EXON 2 BASE PYRIMIDIQUE ATOME 3' DU SUCRE ACIDE PHOSPHORIQUE téines SF2/ASF sont donc en excès relatif. Puisqu’elles favorisent l’excision des introns seuls, tous les exons sont conservés. Toutefois, les différentes protéines SR sont également modifiées par des phosphorylations qui changent leur affinité pour l’ARN. L’épissage alternatif, par la diversité qu’il offre, participe pour une grande part à l’orientation du destin des cellules, telles la mort cellulaire programmée, nommée apoptose, ou la différenciation cellulaire. Ainsi, la toxicité des céramides, des molécules qui dérivent des lipides membranaires, est reliée à une diminution de la phosphorylation des protéines SR qui entraîne une modification de l’épissage des ARN prémessagers des protéines Bclx et de la caspase 9. Ces deux protéines sont des facteurs essentiels de l’apoptose: la première est une protéine anti-apoptose ; la seconde est une enzyme qui dégrade les protéines, une sorte d’«exécuteur» présent en permanence dans la cellule sous une forme inactive. En l’absence de céramides, les protéines codées empêchent l’apoptose, alors qu’en présence des composés toxiques, les nouvelles isoformes protéiques résultant de la modification de l’épissage participent directement à la mort cellulaire. Par exemple, les nouvelles isoformes des caspases sont actives et dégradent les protéines des cellules qui meurent. L’épissage alternatif est adapté aux nécessités de la multiplicité des programmes de différenciation. Les spécialisations cellulaires nécessaires à la 47 296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 48 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER: formation de tissus aussi différents que le cerveau, le muscle ou le foie, requièrent l’expression d’un répertoire d’ARN messagers adaptés à partir d’un génome complexe, mais limité. De nombreux exemples illustrent l’importance de l’épissage alternatif dans ces différenciations. Par exemple, la tropomyosine alpha, une protéine essentielle à l’activité musculaire, est fabriquée dans toutes les cellules à l’exception des muscles striés squelettiques. Grâce à neuf isoformes, l’expression du gène de la tropomyosine alpha s’adapte aux différents contextes tissulaires. Ainsi, dans les cellules musculaires lisses, l’exon 2 de ce gène est présent dans l’ARN messager mature, alors qu’il s’agit de l’exon 3 dans les autres types cellulaires. Par ailleurs, alors que l’exon 13 est exprimé dans la plupart des types cellulaires, l’exon 11 est spécifique des muscles striés squelettiques et l’exon12 est exprimé dans le muscle cardiaque et le cerveau. L’épissage alternatif participe directement aux différenciations en modifiant les fonctions des produits des gènes. Par exemple, lors de la différenciation musculaire, l’alpha-actinine, qui participe à la fixation des fibres contractiles à la membrane des cellules musculaires, devient insensible aux ions calcium: l’exon codant le domaine de liaison à ces ions est éliminé par épissage alternatif ; l’alpha-actinine n’est pas contrôlée par le calcium et fonctionne en permanence. En revanche, dans les autres tissus, ce domaine est présent et le fonctionnement de la protéine est commandé par les ions calcium. L’épissage constitutif ’épissage requiert la participation de nombreuses molécules, notamment les cinq petites particules ribonucléoprotéiques nucléaires (PRNpn) U1, U2, U4, U5 et U6, qui forment avec l’ARN prémessager des complexes. Le complexe E (1) est composé de l’ARN prémessager où se fixent, d’une part, le complexe PRNpn U1 sur l’extrémité 5’ de l’intron à éliminer et, d’autre part, le facteur auxiliaire U2AF, qui s’associe à l’enchaînement de bases pyrimidiques et à l’extrémité 3' de l’intron. Les éléments du complexe E ont une affinité pour des protéines nommées SR, dotées d’un domaine, dit SR, riche en acides aminés sérine et arginine. Ces protéines s’associent au complexe E (2) et entraînent le repliement de l’ARN prémessager en une boucle où les deux extrémités de l’intron sont rapprochées. Le complexe A (3) est formé du L EXON 1 PRNpn complexe précédent associé au complexe PRNpn U2 qui se lie à la séquence de branchement. Le troisième intermédiaire (4), le complexe B, se forme quand les complexes PRNpn U4, U5 et U6 se fixent simultanément au complexe A. Ensuite, le complexe B est le siège de multiples remaniements internes (5) avant de former le complexe C, ou particule d’épissage. Enfin, dans une dernière étape, l’excision proprement dite a lieu: par deux réactions de transestérification (6 et7) où des liaisons ester sont rompues, puis reconstituées différemment, l’intron est éliminé sous la forme d’un lasso (8), tandis que les deux exons sont réunis, puis libérés (9), et les différentes protéines de particule d’épissage sont recyclées pour un nouvel épissage. Cette succession d’événements est le propre de l’épissage constitutif. FACTEUR AUXILIAIRE U2AF SÉQUENCE DE BRANCHEMENT PREMIÈRE TRANSESTÉRIFICATION U1 GU EXTRÉMITÉ 5' DE L'INTRON A Pyr. COMPLEXE E AG INTRON 6 EXON 2 GU 1 PROTÉINE SR Pyr. A 2 GU A Pyr. AG AG DEUXIÈME TRANSESTÉRIFICATION 7 GU 3 A Pyr. Pyr. GU COMPLEXE A PRNpn AG A Pyr. AG AG U2 Pyr. COMPLEXE B 8 GU 4 A Pyr. Pyr. A GU AG INTRON U4 U6 U5 5 COMPLEXE C (PARTICULE D'ÉPISSAGE) GU 9 A 48 Pyr. Pyr. AG EXON 1 EXON 2 © POUR LA SCIENCE - N° 296 JUIN 2002 296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 49 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER: L’équilibre entre la différenciation, la prolifération et l’apoptose, qui repose sur l’épissage, est parfois rompu, ce qui déclenche des pathologies. Les défauts d’épissage ont principalement deux origines : une mutation de l’une des séquences qui agissent en cis de l’épissage (les protéines ne reconnaissent plus les séquences internes) ; une altération des cascades de signalisation qui perturbe le contrôle de l’épissage assuré par les facteurs ribonucléiques. Plus de 10 pour cent des maladies héréditaires humaines sont associés à des mutations dans les séquences cis situées aux jonctions entre les exons et les introns. Les conséquences de ces mutations sont l’apparition de nouvelles isoformes protéiques aux fonctions altérées par rapport à celles des protéines normales. Cette proportion est sans doute notablement sous-estimée, car elle ne tient pas compte des mutations possibles des séquences situées dans les exons qui participent également à l’épissage. Cependant, ces mutations sont difficiles à identifier. Épissages malheureux Par ailleurs, on a découvert que de nombreuses mutations, dites silencieuses, soit dans les exons, soit dans les introns, ont un impact sur les épissages. Ces mutations silencieuses créent parfois de nouveaux sites d’épissage et entraînent l’expression de nouvelles isoformes. Dans ce cas, les conséquences sont le plus souvent un déséquilibre entre les isoformes naturelles et les isoformes anormales qui ont des fonctions distinctes, voire antagonistes. L’épissage alternatif es protéines SR sont dotées d’un domaine SR qui autorise leur association avec les éléments du complexe E, mais aussi d’un ou de deux domaines qui reconnaissent des séquences activatrices de l’épissage présentes au milieu d’exons dans l’ARN prémessager. Cette double affinité est la clef de l’épissage alternatif. L’étude de la protéine SR nommée SF2/ASF a révélé les différentes modalités d’action de l’épissage alternatif. Plusieurs cas sont à distinguer. Quand un intron est doté d’un site d’épissage fort, c’està-dire d’un enchaînement de pyrimidines uniquement, le facteur U2AF est bien positionné et remplit son rôle correctement : les protéines SR s’associent par leurs domaines SR avec PRNpn U1 et le facteur U2AF, et plient l’ARN prémessager au niveau des seuls introns qui sont éliminés : c’est le cas d’un épissage constitutif. En revanche, lorsque l’enchaînement de bases pyrimidiques est interrompu par quelques bases puriques, la fixation du facteur U2AF est alors «bancale», et la reconnaissance du site d’épissage requiert en plus la liaison de protéines SR, par leurs domaines de reconnaissance de l’ARN, à une L séquence activatrice de l’épissage située dans l’exon qui suit l’intron. Ce besoin d’un «soutien» offre à la cellule un moyen de choisir le fragment d’ARN à éliminer. En effet, la séquence activatrice de l’épissage située dans l’exon fait l’objet d’une compétition entre, d’une part, la protéine SF2/ASF et, d’autre part, la protéine nommée PRNhn A1. Des études ont montré que de cette compétition (1) résulte un antagonisme au niveau du choix des extrémités de l’ARN épissé. Lorsque la protéine SF2/ASF est en quantité supérieure dans le noyau, elle se lie, sur l’ensemble de l’ARN prémessager, aux PRNpn U1, aux facteurs auxiliaires U2AF et aux séquences activatrices d’épissage. Puis, par le jeu des affinités des multiples molécules, elles replient l’ARN prémessager au niveau des introns (l’étape 2 montre le repliement de deux introns) qui sont éliminés (3). En revanche, quand la protéine PRNhn A1 (qui se lie aux mêmes endroits que la protéine SF2/ASF) domine, le repliement est différent : un fragment d’ARN plus long qui contient deux introns et un exon (4) est éliminé (5). PROTÉINE SF2/ASF PROTÉINE PRNhn A1 1 FACTEUR U2AF PRNpn U1 EXON 1 INTRON 1 EXON 2 INTRON 2 2 EXON 3 SÉQUENCE ACTIVATRICE D'ÉPISSAGE 4 PARTICULE D'ÉPISSAGE INTRON 1 INTRON 2 EXON 2 INTRON 1 INTRON 2 ARN MESSAGER MATURE 5 3 EXON 1 EXON 2 ÉLIMINATION DES DEUX INTRONS © POUR LA SCIENCE - N° 296 JUIN 2002 EXON 3 EXON 1 EXON 3 ÉLIMINATION D'UN EXON ET DES DEUX INTRONS 49 296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 50 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER: EXON ALTERNATIF PROMOTEUR ALPHA EXON CONSTITUTIF PROMOTEUR BÊTA EXON 20 MEMBRANE PRÉSYNAPTIQUE NEUROLIGINE FRAGMENT CODÉ PAR L'EXON 20 NEURÉXINE MEMBRANE POSTSYNAPTIQUE SYNAPSE ACTIVE 4. LE GÈNE DE LA NEURÉXINE (en haut) est composé d’exons constitutifs (en vert), qui sont toujours inclus dans l’ARN messager et d’exons facultatifs (en jaune), qui ne sont pas toujours conservés dans l’ARN messager. De surcroît, le gène est doté de deux promoteurs (en bleu), des séquences qui indiquent où la transcription commence, multipliant encore le nombre de protéines (les traits roses) codées De telles modifications, par mutations ou par altérations des cascades de signalisation, sont présentes dans des pathologies aussi diverses que les myopathies, les cancers et les maladies neurodégénératives. Par exemple, certaines démences et la maladie d’Alzheimer sont associées à des modifications d’épissage de l’ARN messager de la protéine tau par l’inclusion de l’exon 10 dans l’ARN messager mature : les protéines tau anormales s’accumulent dans le cytoplasme des neurones et déforment les microtubules dont le fonctionnement est perturbé. L’atrophie musculaire spinale est aussi une conséquence de défauts dans l’épissage alternatif : deux copies du gène Smn, qui codent une protéine de la particule d’épissage dans les neurones, sont présentes sur le même chromosome, l’une, télomérique, située à une extrémité, l’autre, centromérique, plus proche du centre. Lorsque la copie télomérique est la cible de mutations à l’origine de la maladie, la copie centromérique ne parvient pas à compenser le défaut en protéine Smn, car l’exon 7 est éliminé par épissage alternatif : il s’ensuit une modification de la répartition de la protéine dans les cellules. Cet exon participe peut-être à la reconnaissance de la protéine par des transporteurs cellulaires. L’exemple précédent montre que les modifications de fonctions observées entre les différentes isoformes résultent souvent de variations de compartimentation, c’est-à-dire des localisations 50 PAS DE CONNEXION SYNAPTIQUE par le gène. La neuréxine participe à l’établissement des synapses : quand l’exon 20 (en jaune cerné de rouge) n’est pas inséré dans l’ARN messager, la neuréxine d’un neurone se lie à une autre protéine, la neuroligine, située sur un autre neurone et favorise la synapse (à gauche). À l’inverse, quand cet exon est inséré, les deux protéines ne se reconnaissent plus, la synapse ne se forme pas (à droite). intracellulaires des protéines fabriquées. C’est aussi le cas dans plusieurs pathologies inflammatoires où des formes solubles de récepteurs produites par l’exclusion d’exons codant la partie transmembranaire de la protéine ont été mises en évidence. Ces récepteurs solubles fixent toujours la molécule messagère, mais l’information n’est pas transmise à l’intérieur des cellules sur lesquelles ils sont normalement fixés. Le développement du VIH passe aussi par des modifications de l’épisage alternatif. Chez les lymphocytes T, la protéine Grb2 participe à la transmission de signaux extérieurs. Cependant, lorsque les lymphocytes sont infectés par le VIH 1, l’épissage de cette protéine est modifié : l’exon 3 n’est plus inséré dans l’ARN messager mature. Cette nouvelle version de la protéine, nommée Grb3.3, qui n’est pas fabriquée dans les tissus sains, participe à l’élaboration d’un nouveau chemin de transmission de signaux qui favorise la réplication virale. Un répertoire d’ ARN messagers donné révèle l’état d’une cellule, c’està-dire les gènes qu’elle exprime et de quelle façon ils sont épissés. Aussi, chaque situation physiologique ou pathologique peut être caractérisée par l’ensemble des modifications des ARN messagers, dont l’étude révèle les mécanismes des pathologies. La comparaison des ARN messagers d’une cellule saine et d’une cellule anormale indiquerait quelles modifications, notamment d’épissage, sont à l’origine de la maladie. Parmi les moyens d’étude de l’épissage, les puces à ADN suscitent beaucoup d’enthousiasme. Sur un support en verre, on dépose des séquences d’ ADN connues qui sont mises en contact avec des copies d’ADN, dit complémentaire, des ARN messagers cellulaires. Ces copies sont marquées par des molécules fluorescentes, aussi on identifie facilement les ARN cellulaires en analysant par un scanner la fluorescence en chaque point de la puce. L’inscription au répertoire Ces techniques sont bien adaptées à l’étude de variations quantitatives des ARN messagers, mais, dans le cadre de l’étude des épissages, on est confronté à une situation difficile. En effet, avec de telles puces, on cherche à suivre l’inclusion ou l’exclusion de certains exons au sein de populations d’ARN messagers. Or, quand la séquence fixée sur la puce correspond à celle d’un exon, les ADN complémentaires qui s’y fixent le contiennent toutes sans pour autant être tous identiques : des ARN messagers différant par un autre exon que celui fixé sur la puce ne sont pas distingués. En revanche, si les séquences, à la surface de ces puces, correspondent aux différentes jonctions possibles entre les exons, on suivrait l’apparition de nouvelles espèces d’ARN messagers qui résultent de l’élimination de certains exons lors des épissages alternatifs. Par exemple, quand une protéine normale est composée de tous les exons de l’ARN prémessager, une protéine anormale résultant de l’absence de l’exon 4 serait © POUR LA SCIENCE - N° 296 JUIN 2002 296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 51 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER: détectée par la séquence de la jonction entre l’exon 3 et l’exon 5. Hélas, cette stratégie reste théorique, car le nombre de toutes les jonctions qui peuvent être créées par l’épissage alternatif est très grand. De plus, l’examen du génome ne permet pas une prédiction suffisante de ces jonctions, notamment des sites qui sont démasqués lors de dysfonctionnement des voies de signalisation. À la recherche des jonctions Une meilleure approche passe par l’identification des gènes dont les ARN messagers sont réorganisés à la suite d’altérations du mécanisme d’épissage alternatif dans des conditions pathologiques. Récemment, nous avons mis au point une telle méthode, nommée DATAS, afin d’identifier de façon systématique au sein d’une population d’ARN messagers les différents événements d’épissage qui coexistent dans deux situations physiopathologiques ou bien, à l’inverse, les distinguent. Grâce à cette technique, on constitue des banques d’exons et d’introns, grâce auxquelles on identifie rapidement les arrangements d’exons propres aux phénomènes étudiés et donc, les séquences de jonction adaptées au suivi des maladies. Ainsi, dans une première étape, les études des modifications de l’épissage qui caractérisent les différentes étapes d’une maladie contribueraient à l’obtention d’une image des variations de l’expression génétique, et notamment de l’épissage. On obtiendrait alors, dans une seconde étape, de nouvelles méthodes de diagnostic fondées sur les modifications des protéines codées. Par exemple, dans le cas des cancers, le décryptage des ARN messagers issus de l’épissage identifiera les domaines modifiés des protéines membranaires contre lesquels on développerait des anticorps spécifiques des cellules tumorales. Fabien SCHWEIGHOFFER est directeur général de la Société Exonhit, responsable des programmes thérapeutiques. Douglas BLACK, Protein Diversity from Alternative Splicing : A Challenge for Bioinformatics and Post-Genome Biology, in Cell, vol. 103, pp. 367–370, 2000. Xuguang LI et al., Grb3-3 Is Up-regulated in HIV-1-infected T-cells and Can Potentiate Cell Activation through NFATc, in The Journal of Biological Chemistry, vol. 275, 2000. © POUR LA SCIENCE - N° 296 JUIN 2002 Outre le diagnostic, les modifications pathologiques d’épissage seront peutêtre utiles pour mettre au point des fragments de nucléotides spécifiques ou des molécules qui agiront sur les cascades enzymatiques qui les commandent. L’identification des altérations, à la suite de l’épissage, d’enzymes et de récepteurs constitue le premier pas du développement d’inhibiteurs efficaces. La solution de l’épissage alternatif, retenue par l’évolution, pour augmenter le nombre de protéines en maintenant constant le génome, est la clef de la complexité des animaux supérieurs et de l’adaptation des cellules aux différentes situations rencontrées. Cette solution présente plusieurs avantages. Une autre solution aurait pu être l’augmentation de la taille du génome : cette stratégie aurait multiplié les protéines, mais aussi le risque d’erreurs, car, lors de la réplication de l’ADN, au moment de la division cellulaire, la fréquence de «fautes de copie» est constante. Toutefois, l’épissage alternatif n’est pas la seule option retenue pour augmenter la diversité des protéines. La protéolyse en est une autre : selon le contexte cellulaire, un domaine d’une protéine peut être découpé, conférant ainsi de nouvelles propriétés à la protéine. Par exemple, les récepteurs, tels ceux de l’hormone de croissance, sont parfois rendus solubles après le clivage de leur partie membranaire. L’hormone circulante est toujours fixée, mais l’information qu’elle véhicule n’est plus transmise à l’intérieur des cellules. Bien entendu, les mécanismes de l’épissage alternatif et de la protéolyse sont différents, mais tous deux sont complémentaires, l’un est en amont, l’autre en aval de la synthèse des protéines. Tous deux participent à une adaptation très fine des cellules : 30 000 gènes pour une quasi-infinité de protéines. Zhihong LIU et al., Structural Basis for Recognition of the Intron Branch Site RNA by Splicing Factor 1, in Science, vol. 294, pp. 1098-1102, 2001. Wolfgang E NARD et al., Intra- and Interspecific Variation in Primate Gene Expression Patterns, in Science, vol. 296, pp. 340-343, 2002. Eran MESHORER et al., Alternative Splicing and Neuritic mRNA Translocation Under Long-Term Neuronal Hypersensitivity, in Science, vol. 295, pp. 508-512, 2002. 51