Un même gène pour plusieurs protéines

publicité
296 - SCHWEIGHOFFER 03/05 14/05/02 12:41 Page 44 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER:
Un même gène pour
plusieurs protéines
FABIEN SCHWEIGHOFFER
Au cours de l’évolution, les mécanismes de la synthèse
des protéines se sont dotés d’un moyen d’offrir
aux cellules une diversité quasi infinie de protéines
à partir d’un nombre limité de gènes : l’épissage alternatif.
’être humain et le chimpanzé, son plus proche cousin,
ont en commun 98,7 pour cent de leurs gènes. La différence suffit-elle à expliquer leurs dissemblances tant morphologiques que comportementales et cognitives?
L’équipe de Svante Pääbo, de l’Institut Max Planck, à Leipzig, en Allemagne, a montré que la distinction résulte surtout
de variations dans l’expression des gènes selon les organes:
très similaires dans des organes, tel le foie, ou dans le sang,
la quantité de protéines fabriquées par le cerveau humain
est notablement supérieure à celle que présente le cerveau
des autres primates. Nous devrions notre «supériorité» à une
expression génétique plus intense dans notre cerveau.
Ainsi, les génomes diffèrent peu, mais la façon dont les cellules les utilisent varie, et ce, grâce à un mécanisme élaboré,
la synthèse protéique. Celle-ci consiste d’abord à transcrire
les gènes de l’ADN en ARN prémessagers, puis, après un
processus de maturation nommé épissage, à traduire ces ARN
devenus messagers en protéines. Ce mécanisme participe à
la diversité du monde vivant et a joué un rôle dans l’apparition de l’être humain; de nombreux acteurs le contrôlent
et le guident dans l’accomplissement de sa tâche. Si la transcription participe à la différence entre l’être humain et les
autres primates, la seconde étape de la synthèse protéique,
l’épissage, a joué un rôle dans la «supériorité» des mammifères par rapport aux autres animaux.
En effet, un dogme de la génétique voulait que le nombre
de gènes diffère peu de celui des protéines fabriquées par les
cellules. Or, le dogme est tombé. En 2001, deux organisations
rivales ont séquencé le génome humain. Le résultat est sans
appel, et confirme ce que des études préalables avaient montré : le génome humain est constitué de 30 000 à 40 000 gènes
seulement, à peine trois fois plus qu’une mouche
(14 000 gènes). Passée la surprise, il convenait d’expliquer
comment la complexité et surtout la diversité d’organisation
des tissus des mammifères s’accommodent d’un nombre
de gènes relativement proche de celui d’organismes moins
évolués. Un élément de réponse est apporté par la confrontation des informations issues des programmes de séquençage des génomes avec les résultats des séquençages d’ARN
messagers : chez l’homme, le nombre d’ARN messagers est
L
44
supérieur à 100 000, soit environ trois fois plus que de
gènes. Ainsi chaque gène donne quelque trois ARN, chacun
donnant une protéine différente. On commence à entrevoir
d’où vient la différence entre la drosophile et l’homme!
C’est précisément ce que nous allons examiner. Après avoir
décrit les étapes qui mènent d’un gène à une protéine, nous
détaillerons les mécanismes et les rôles de l’épissage, dont
nous verrons qu’il existe un épissage constitutif – la maturation proprement dite – et un épissage alternatif, à l’origine de
la diversité des ARN messagers produits à partir d’un même
gène, puis les conséquences pathologiques des dysfonctionnements de cet épissage alternatif. Enfin, nous examinerons
pourquoi les biologistes fondent beaucoup d’espoir sur l’épissage alternatif pour élucider le fonctionnement des cellules
et pour mettre au point de nouveaux médicaments.
Du gène aux ARN et de l’ARN aux protéines
Ainsi, au cours de l’évolution, une stratégie a été sélectionnée qui autorise la production de plusieurs ARN messagers
et, par conséquent, de plusieurs protéines, à partir d’un seul
gène : il s’agit de l’épissage, l’une des étapes clefs de l’expression génétique. Les ARN prémessagers, copiés de l’ADN,
sont une succession de régions codantes, les exons, qui sont
traduites en protéines, et de régions non codantes, les introns.
L’épissage constitutif consiste à éliminer ces derniers et à
juxtaposer les exons pour former un ARN messager mature
qui est ensuite traduit en une protéine par les ribosomes.
L’épissage alternatif multiplie les résultats de cette maturation. En effet, tous les exons ne sont pas retenus pour former
l’ARN messager mature: pour au moins 60 pour cent des gènes
humains, l’épissage alternatif se superpose à l’épissage
1. UNE CELLULE contient entre 30 000 et 40 000 gènes. Cependant,
elle fabrique au moins trois fois plus de protéines. L’ARN polymérase copie le gène en un ARN prémessager composé d’exons codants
et d’introns non codants qui sont éliminés durant l’épissage
constitutif. Selon le contexte cellulaire, certains exons sont conservés, d’autres sont éliminés et les exons restants sont juxtaposés :
c’est l’épissage alternatif. Au final, selon l’ARN messager obtenu,
un même gène code plusieurs protéines.
© POUR LA SCIENCE - N° 296 JUIN 2002
296 - SCHWEIGHOFFER 03/05 14/05/02 12:41 Page 45 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER:
NOYAU
ARN POLYMÉRASE
PORE NUCLÉAIRE
ADN
ARN PRÉMESSAGER
ÉPISSAGE
ALTERNATIF
INTRON
EXCISÉ
ARN MESSAGER 2
ARN MESSAGER 1
CYTOPLASME
PROTÉINE 2
Delphine Bailly
RIBOSOME
PROTÉINE 1
296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 46 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER:
ARN POLYMÉRASE
1
2
ARN PRÉMESSAGER
3
INTRON
ÉLIMINÉ
4
ARN MESSAGER
MATURE
constitutif et, selon le contexte cellulaire,
ajoute ou retire un exon pour former
l’ARN messager mature. Les multiples
protéines fabriquées à partir de ces ARN
messagers sont des isoformes protéiques.
Dans telle cellule, un gène donné
code une protéine, alors que dans une
autre cellule, ou dans la même à un
moment différent, le même gène code
une autre protéine, différant de la première par une portion de sa séquence
en acides aminés. Ces deux protéines
peuvent avoir des fonctions différentes.
Par exemple, de nombreuses cellules
sécrètent de la fibronectine, une protéine adhésive. Cependant, celle des
fibroblastes est dotée de domaines protéiques grâce auxquels elle se fixe aux
cellules, alors que celle des cellules du
foie est dépourvue de ces domaines et
qu’elle est transportée par le sang.
Un destin de protéine
5
6
RIBOSOME
7
PROTÉINE
Le génome, c’est-à-dire le répertoire des
gènes d’un organisme dont le support
est l’ADN, donne naissance, via la transcription, à un répertoire constitué d’ARN
nommé transcriptome. L’ADN est un
polymère de nucléotides (voir la figure 3),
des molécules constituées d’acide phosphorique, d’un sucre, le désoxyribose,
et d’une molécule nommée base azotée
dont les quatre principales sont l’adénine, la thymine, la cytosine et la guanine. L’adénine et la guanine, dérivées
de la purine, sont des bases puriques ;
la thymine et la cytosine sont des bases
pyrimidiques. La protéine est codée par
les bases. L’ARN diffère par la nature du
sucre, le ribose, de ses nucléotides, et
par une base pyrimidique, l’uracile, qui
remplace la thymine. L’ADN et l’ARN
sont deux acides nucléiques orientés :
dans un nucléotide, l’acide phosphorique est lié à l’atome de carbone numéroté 5' de la molécule de sucre. Les
nucléotides s’associent par des liaisons ester de l’acide phosphorique d’un
nucléotide à l’atome de carbone 3' du
sucre du nucléotide suivant. Ainsi, un
brin d’ADN (ou un brin d’ARN) a une
extrémité 5' et une extrémité 3'.
Le transcriptome est composé de
deux catégories d’ARN : les précurseurs
2. LA SYNTHÈSE DES PROTÉINES. Dans le
noyau d’une cellule, un gène (1) est transcrit
par une enzyme, l’ARN polymérase, en un ARN
prémessager (2), qui est une succession (3)
d’exons codants et d’introns non codants. Lors
de l’épissage (4), les introns sont éliminés et
les exons juxtaposés dans l’ARN messager
mature (5). Celui-ci sort du noyau et est traduit par les ribosomes (6) en une protéine (7).
46
des ARN messagers, ou ARN prémessagers, et les ARN messagers matures.
Les ARN prémessagers sont des copies
quasi conformes des gènes. Ce sont
plus exactement des copies «en négatif» de l’ADN, en raison des lois d’appariement des bases complémentaires.
En effet, lors de la synthèse protéique
(voir la figure 2), une enzyme, l’ARN
polymérase, parcourt le gène et
fabrique peu à peu l’ARN prémessager
en respectant les règles d’appariement
qui résultent de la structure des bases
azotées : aux bases adénine, thymine,
cytosine et guanine de l’ADN correspondent respectivement les bases uracile, adénine, guanine et cytosine de
l’ ARN . Puis l’ ARN prémessager est
transformé en un ARN messager lors
de l’épissage : l’épissage constitutif
enlève seulement les introns, alors que
l’épissage alternatif ôte parfois un ou
plusieurs exons.
Ainsi, certains gènes donnent naissance à plusieurs versions d’ARN messagers matures, distincts par un ou
plusieurs exons, à l’origine de plusieurs protéines différentes. Par
exemple, le gène neurexin (voir la
figure 4), qui code des protéines participant à la formation des synapses,
peut être à l’origine de plus de
2 000 ARN messagers matures différents. Le nombre de protéines différentes codées par un même gène atteint
parfois plusieurs dizaines de milliers. Le dogme «un gène, une protéine» a vécu !
À l’instar de la transcription, où, par
exemple, une séquence d’ADN nommée promoteur indique où l’ARN polymérase se fixe, l’épissage est commandé
par des séquences d’ARN, présentes
dans les ARN prémessagers, et par de
nombreux édifices moléculaires composés d’ARN et de protéines. Les premiers indiquent aux seconds où ils
doivent se fixer. On dit que les premiers
agissent en cis (de l’intérieur de l’ARN
prémessager), alors que les seconds
agissent en trans (de l’extérieur).
Certaines séquences cis sont présentes aux jonctions entre les exons et
les introns, d’autres, nommées silenceurs ou activateurs, influent à distance sur l’épissage. Nous verrons que
ces séquences qui agissent à distance
participent plus particulièrement à
l’épissage alternatif, alors que les
séquences qui marquent les extrémités des exons et des introns interviennent dans les deux types
d’épissages. Ces dernières séquences
© POUR LA SCIENCE - N° 296 JUIN 2002
296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 47 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER:
EXON 1
SÉQUENCE DE
BRANCHEMENT
EXTRÉMITÉ 5'
DE L'INTRON
5'
GU
EXTRÉMITÉ 3'
DE L'EXON
A
INTRON
EXTRÉMITÉ 3'
DE L'INTRON
Pyr.
ENCHAÎNEMENT DE
BASES PYRIMIDIQUES
BASE PURIQUE
3. L’ARN PRÉMESSAGER est une succession de nucléotides (ci-contre),
composés d’une base azotée purique (adénine ou guanine) ou pyrimidique (uracile ou cytosine), d’un sucre, le ribose, et d’acide
phosphorique qui les relie entre eux selon une direction 5’ vers 3’.
Cet enchaînement constitue une succession d’exons (ci-dessus,
en vert) et d’introns (en rouge). On distingue plusieurs régions
qui participent à l’épissage : les jonctions entre les exons et les
introns, où la guanine (G) et l’uracile (U) marquent le début des
introns (extrémité 5’) ; les jonctions entre les introns et les exons
où l’adénine (A) et la guanine (G) indiquent la fin des introns (extréATOME 5' SUCRE
mité 3’) ; enfin, dans chaque intron, une séquence de branchement,
DU SUCRE
reconnue par les molécules participant à l’épissage et qui contient toujours une adénine (A) et un enchaînement de bases pyrimidiques (Pyr). Par
ailleurs, les exons contiennent aussi des séquences activatrices de l’épissage.
sont bien conservées à travers le règne
vivant et on les représente par des
séquences consensus où apparaissent
les bases communes : par exemple, un
intron commence toujours par une
guanine et un uracile. En revanche,
les séquences des silenceurs et des activateurs varient notablement et on ne
les identifie qu’au cas par cas.
La maturation des ARN prémessagers met en jeu cinq petites particules
ribonucléoprotéiques nucléaires
(PRNpn), composées d’ARN et de protéines, nommées U1, U2, U4, U5 et U6,
qui fonctionnent en synergie avec un
grand nombre d’autres protéines. Ces
complexes reconnaissent sur les ARN
prémessagers plusieurs endroits (voir
la figure 3) : l’extrémité 5’ des introns,
constituée de quatre bases ; une
séquence de branchement, d’environ
dix bases, et un enchaînement de 14
bases pyrimidiques, la cytosine et l’uracile, proches de l’extrémité 3’ (cet
enchaînement est parfois ponctué de
quelques bases puriques) ; enfin, l’extrémité 3’ elle-même, longue de quatre
bases, qui marque la fin de l’intron.
Les intermédiaires de l’assemblage
des différents complexes sur les ARN
prémessagers ont été mis en évidence
et ont révélé les étapes de l’épissage
(voir l’encadré de la page 48). Peu à peu,
des molécules, dont les PRNpn U1, U2,
U4, U5 et U6, mais aussi des protéines
nommées SR , dotées d’un domaine
dit SR riche en acides aminés sérine et
arginine, se lient à l’ARN prémessager,
le replient, puis éliminent les introns.
Cette succession d’événements est le
© POUR LA SCIENCE - N° 296 JUIN 2002
propre de l’épissage constitutif. Comment devient-il alternatif?
Les protéines du destin
Dans certains cas (voir l’encadré de la
page 49), notamment quand la séquence
de bases pyrimidiques est interrompue par des bases puriques, la reconnaissance d’un site d’épissage requiert
la fixation de protéines SR sur des
séquences activatrices d’épissage situées
dans les exons. Or, ces séquences sont
aussi la cible d’autres protéines, telles
les protéines PRNhn A1 qui influent sur
l’épissage : selon que les protéines SR
sont plus (ou moins) abondantes dans
le noyau que les protéines PRNhn A1, un
seul intron ou un exon flanqué de deux
introns, est éliminé.
La compétition entre les protéines
à domaine SR et les protéines PRNhn A1
est ainsi le facteur essentiel de l’épissage
alternatif. En amont, le fonctionnement
de ces protéines, et, par conséquent,
l’épissage alternatif lui-même, est commandé par les différents chemins de
signalisation cellulaire où une molécule
messagère extracellulaire, entraîne, par
sa fixation à un récepteur membranaire,
une cascade de réactions intracellulaires.
Les chemins de signalisation cellulaire modifient notamment la phosphorylation (la fixation de groupes
acides phosphoriques) des protéines SR
et des protéines PRNhn. Par exemple, la
phosphorylation des protéines PRNhn A1
entraîne leur reconnaissance par des protéines du cytoplasme qui les empêchent
de pénétrer dans le noyau où les pro-
SÉQUENCE ACTIVATRICE
DE L'ÉPISSAGE
3'
AG
EXTRÉMITÉ 5'
DE L'EXON 2
EXON 2
BASE PYRIMIDIQUE
ATOME 3'
DU SUCRE
ACIDE
PHOSPHORIQUE
téines SF2/ASF sont donc en excès relatif. Puisqu’elles favorisent l’excision des
introns seuls, tous les exons sont conservés. Toutefois, les différentes protéines SR
sont également modifiées par des phosphorylations qui changent leur affinité pour l’ARN.
L’épissage alternatif, par la diversité qu’il offre, participe pour une grande
part à l’orientation du destin des cellules, telles la mort cellulaire programmée, nommée apoptose, ou la
différenciation cellulaire. Ainsi, la
toxicité des céramides, des molécules
qui dérivent des lipides membranaires,
est reliée à une diminution de la phosphorylation des protéines SR qui
entraîne une modification de l’épissage
des ARN prémessagers des protéines Bclx et de la caspase 9. Ces deux
protéines sont des facteurs essentiels de
l’apoptose: la première est une protéine
anti-apoptose ; la seconde est une
enzyme qui dégrade les protéines, une
sorte d’«exécuteur» présent en permanence dans la cellule sous une forme
inactive. En l’absence de céramides,
les protéines codées empêchent l’apoptose, alors qu’en présence des composés toxiques, les nouvelles isoformes
protéiques résultant de la modification de l’épissage participent directement à la mort cellulaire. Par exemple,
les nouvelles isoformes des caspases
sont actives et dégradent les protéines
des cellules qui meurent.
L’épissage alternatif est adapté aux
nécessités de la multiplicité des programmes de différenciation. Les spécialisations cellulaires nécessaires à la
47
296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 48 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER:
formation de tissus aussi différents que
le cerveau, le muscle ou le foie, requièrent l’expression d’un répertoire d’ARN
messagers adaptés à partir d’un
génome complexe, mais limité. De nombreux exemples illustrent l’importance
de l’épissage alternatif dans ces différenciations. Par exemple, la tropomyosine alpha, une protéine essentielle
à l’activité musculaire, est fabriquée
dans toutes les cellules à l’exception
des muscles striés squelettiques. Grâce
à neuf isoformes, l’expression du gène
de la tropomyosine alpha s’adapte aux
différents contextes tissulaires. Ainsi,
dans les cellules musculaires lisses,
l’exon 2 de ce gène est présent dans
l’ARN messager mature, alors qu’il s’agit
de l’exon 3 dans les autres types cellulaires. Par ailleurs, alors que l’exon 13
est exprimé dans la plupart des types
cellulaires, l’exon 11 est spécifique des
muscles striés squelettiques et l’exon12
est exprimé dans le muscle cardiaque
et le cerveau.
L’épissage alternatif participe directement aux différenciations en modifiant les fonctions des produits des
gènes. Par exemple, lors de la différenciation musculaire, l’alpha-actinine,
qui participe à la fixation des fibres
contractiles à la membrane des cellules
musculaires, devient insensible aux
ions calcium: l’exon codant le domaine
de liaison à ces ions est éliminé par
épissage alternatif ; l’alpha-actinine
n’est pas contrôlée par le calcium
et fonctionne en permanence. En
revanche, dans les autres tissus, ce
domaine est présent et le fonctionnement de la protéine est commandé par
les ions calcium.
L’épissage constitutif
’épissage requiert la participation de nombreuses molécules, notamment les cinq petites particules ribonucléoprotéiques nucléaires
(PRNpn) U1, U2, U4, U5 et U6, qui forment avec l’ARN prémessager des
complexes. Le complexe E (1) est composé de l’ARN prémessager où
se fixent, d’une part, le complexe PRNpn U1 sur l’extrémité 5’ de l’intron à éliminer et, d’autre part, le facteur auxiliaire U2AF, qui s’associe
à l’enchaînement de bases pyrimidiques et à l’extrémité 3' de l’intron.
Les éléments du complexe E ont une affinité pour des protéines nommées SR, dotées d’un domaine, dit SR, riche en acides aminés sérine
et arginine. Ces protéines s’associent au complexe E (2) et entraînent
le repliement de l’ARN prémessager en une boucle où les deux extrémités de l’intron sont rapprochées. Le complexe A (3) est formé du
L
EXON 1
PRNpn
complexe précédent associé au complexe PRNpn U2 qui se lie à la
séquence de branchement. Le troisième intermédiaire (4), le complexe B, se forme quand les complexes PRNpn U4, U5 et U6 se fixent
simultanément au complexe A. Ensuite, le complexe B est le siège de
multiples remaniements internes (5) avant de former le complexe C,
ou particule d’épissage. Enfin, dans une dernière étape, l’excision
proprement dite a lieu: par deux réactions de transestérification (6 et7)
où des liaisons ester sont rompues, puis reconstituées différemment,
l’intron est éliminé sous la forme d’un lasso (8), tandis que les deux
exons sont réunis, puis libérés (9), et les différentes protéines de particule d’épissage sont recyclées pour un nouvel épissage. Cette succession d’événements est le propre de l’épissage constitutif.
FACTEUR
AUXILIAIRE U2AF
SÉQUENCE DE
BRANCHEMENT
PREMIÈRE
TRANSESTÉRIFICATION
U1
GU
EXTRÉMITÉ 5'
DE L'INTRON
A
Pyr.
COMPLEXE E
AG
INTRON
6
EXON 2
GU
1
PROTÉINE SR
Pyr.
A
2
GU
A
Pyr.
AG
AG
DEUXIÈME
TRANSESTÉRIFICATION
7
GU
3
A
Pyr.
Pyr.
GU
COMPLEXE A
PRNpn
AG
A
Pyr.
AG
AG
U2
Pyr.
COMPLEXE B
8
GU
4
A
Pyr.
Pyr.
A
GU
AG
INTRON
U4
U6
U5
5
COMPLEXE C
(PARTICULE D'ÉPISSAGE)
GU
9
A
48
Pyr.
Pyr.
AG
EXON 1
EXON 2
© POUR LA SCIENCE - N° 296 JUIN 2002
296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 49 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER:
L’équilibre entre la différenciation,
la prolifération et l’apoptose, qui repose
sur l’épissage, est parfois rompu, ce qui
déclenche des pathologies. Les défauts
d’épissage ont principalement deux origines : une mutation de l’une des
séquences qui agissent en cis de l’épissage (les protéines ne reconnaissent plus
les séquences internes) ; une altération
des cascades de signalisation qui perturbe le contrôle de l’épissage assuré
par les facteurs ribonucléiques.
Plus de 10 pour cent des maladies
héréditaires humaines sont associés
à des mutations dans les séquences
cis situées aux jonctions entre les exons
et les introns. Les conséquences de
ces mutations sont l’apparition de
nouvelles isoformes protéiques aux
fonctions altérées par rapport à celles
des protéines normales. Cette proportion est sans doute notablement
sous-estimée, car elle ne tient pas
compte des mutations possibles des
séquences situées dans les exons qui
participent également à l’épissage.
Cependant, ces mutations sont difficiles à identifier.
Épissages malheureux
Par ailleurs, on a découvert que de nombreuses mutations, dites silencieuses,
soit dans les exons, soit dans les introns,
ont un impact sur les épissages. Ces
mutations silencieuses créent parfois
de nouveaux sites d’épissage et entraînent l’expression de nouvelles isoformes. Dans ce cas, les conséquences
sont le plus souvent un déséquilibre
entre les isoformes naturelles et les
isoformes anormales qui ont des fonctions distinctes, voire antagonistes.
L’épissage alternatif
es protéines SR sont dotées d’un domaine SR qui autorise leur
association avec les éléments du complexe E, mais aussi d’un
ou de deux domaines qui reconnaissent des séquences activatrices de l’épissage présentes au milieu d’exons dans l’ARN prémessager. Cette double affinité est la clef de l’épissage alternatif.
L’étude de la protéine SR nommée SF2/ASF a révélé les différentes modalités d’action de l’épissage alternatif. Plusieurs cas sont
à distinguer. Quand un intron est doté d’un site d’épissage fort, c’està-dire d’un enchaînement de pyrimidines uniquement, le facteur U2AF
est bien positionné et remplit son rôle correctement : les protéines
SR s’associent par leurs domaines SR avec PRNpn U1 et le facteur U2AF,
et plient l’ARN prémessager au niveau des seuls introns qui sont éliminés : c’est le cas d’un épissage constitutif. En revanche, lorsque
l’enchaînement de bases pyrimidiques est interrompu par quelques
bases puriques, la fixation du facteur U2AF est alors «bancale», et la
reconnaissance du site d’épissage requiert en plus la liaison de protéines SR, par leurs domaines de reconnaissance de l’ARN, à une
L
séquence activatrice de l’épissage située dans l’exon qui suit l’intron.
Ce besoin d’un «soutien» offre à la cellule un moyen de choisir le
fragment d’ARN à éliminer.
En effet, la séquence activatrice de l’épissage située dans
l’exon fait l’objet d’une compétition entre, d’une part, la protéine SF2/ASF
et, d’autre part, la protéine nommée PRNhn A1. Des études ont
montré que de cette compétition (1) résulte un antagonisme au
niveau du choix des extrémités de l’ARN épissé. Lorsque la protéine SF2/ASF est en quantité supérieure dans le noyau, elle se lie,
sur l’ensemble de l’ARN prémessager, aux PRNpn U1, aux facteurs
auxiliaires U2AF et aux séquences activatrices d’épissage. Puis, par
le jeu des affinités des multiples molécules, elles replient l’ARN prémessager au niveau des introns (l’étape 2 montre le repliement de
deux introns) qui sont éliminés (3). En revanche, quand la protéine
PRNhn A1 (qui se lie aux mêmes endroits que la protéine SF2/ASF)
domine, le repliement est différent : un fragment d’ARN plus long
qui contient deux introns et un exon (4) est éliminé (5).
PROTÉINE
SF2/ASF
PROTÉINE
PRNhn A1
1
FACTEUR
U2AF
PRNpn U1
EXON 1
INTRON 1
EXON 2
INTRON 2
2
EXON 3
SÉQUENCE
ACTIVATRICE
D'ÉPISSAGE
4
PARTICULE D'ÉPISSAGE
INTRON 1
INTRON 2
EXON 2
INTRON 1
INTRON 2
ARN MESSAGER MATURE
5
3
EXON 1
EXON 2
ÉLIMINATION DES DEUX INTRONS
© POUR LA SCIENCE - N° 296 JUIN 2002
EXON 3
EXON 1
EXON 3
ÉLIMINATION D'UN EXON ET DES DEUX INTRONS
49
296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 50 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER:
EXON
ALTERNATIF
PROMOTEUR ALPHA
EXON
CONSTITUTIF
PROMOTEUR BÊTA
EXON 20
MEMBRANE
PRÉSYNAPTIQUE
NEUROLIGINE
FRAGMENT CODÉ
PAR L'EXON 20
NEURÉXINE
MEMBRANE
POSTSYNAPTIQUE
SYNAPSE ACTIVE
4. LE GÈNE DE LA NEURÉXINE (en haut) est composé d’exons constitutifs (en vert), qui sont toujours inclus dans l’ARN messager et d’exons
facultatifs (en jaune), qui ne sont pas toujours conservés dans l’ARN
messager. De surcroît, le gène est doté de deux promoteurs (en
bleu), des séquences qui indiquent où la transcription commence,
multipliant encore le nombre de protéines (les traits roses) codées
De telles modifications, par mutations ou par altérations des cascades de
signalisation, sont présentes dans des
pathologies aussi diverses que les myopathies, les cancers et les maladies neurodégénératives. Par exemple, certaines
démences et la maladie d’Alzheimer
sont associées à des modifications
d’épissage de l’ARN messager de la protéine tau par l’inclusion de l’exon 10
dans l’ARN messager mature : les protéines tau anormales s’accumulent dans
le cytoplasme des neurones et déforment les microtubules dont le fonctionnement est perturbé.
L’atrophie musculaire spinale est
aussi une conséquence de défauts dans
l’épissage alternatif : deux copies du
gène Smn, qui codent une protéine de
la particule d’épissage dans les neurones, sont présentes sur le même
chromosome, l’une, télomérique,
située à une extrémité, l’autre, centromérique, plus proche du centre.
Lorsque la copie télomérique est la
cible de mutations à l’origine de la
maladie, la copie centromérique ne
parvient pas à compenser le défaut en
protéine Smn, car l’exon 7 est éliminé par épissage alternatif : il s’ensuit une modification de la répartition
de la protéine dans les cellules. Cet
exon participe peut-être à la reconnaissance de la protéine par des transporteurs cellulaires.
L’exemple précédent montre que les
modifications de fonctions observées
entre les différentes isoformes résultent
souvent de variations de compartimentation, c’est-à-dire des localisations
50
PAS DE CONNEXION SYNAPTIQUE
par le gène. La neuréxine participe à l’établissement des synapses :
quand l’exon 20 (en jaune cerné de rouge) n’est pas inséré dans l’ARN
messager, la neuréxine d’un neurone se lie à une autre protéine, la
neuroligine, située sur un autre neurone et favorise la synapse (à
gauche). À l’inverse, quand cet exon est inséré, les deux protéines ne
se reconnaissent plus, la synapse ne se forme pas (à droite).
intracellulaires des protéines fabriquées.
C’est aussi le cas dans plusieurs pathologies inflammatoires où des formes
solubles de récepteurs produites par
l’exclusion d’exons codant la partie
transmembranaire de la protéine ont
été mises en évidence. Ces récepteurs
solubles fixent toujours la molécule messagère, mais l’information n’est pas
transmise à l’intérieur des cellules sur
lesquelles ils sont normalement fixés.
Le développement du VIH passe
aussi par des modifications de l’épisage
alternatif. Chez les lymphocytes T, la
protéine Grb2 participe à la transmission de signaux extérieurs. Cependant,
lorsque les lymphocytes sont infectés
par le VIH 1, l’épissage de cette protéine est modifié : l’exon 3 n’est plus
inséré dans l’ARN messager mature.
Cette nouvelle version de la protéine,
nommée Grb3.3, qui n’est pas fabriquée
dans les tissus sains, participe à l’élaboration d’un nouveau chemin de transmission de signaux qui favorise la
réplication virale.
Un répertoire d’ ARN messagers
donné révèle l’état d’une cellule, c’està-dire les gènes qu’elle exprime et de
quelle façon ils sont épissés. Aussi,
chaque situation physiologique ou
pathologique peut être caractérisée
par l’ensemble des modifications des
ARN messagers, dont l’étude révèle les
mécanismes des pathologies.
La comparaison des ARN messagers
d’une cellule saine et d’une cellule anormale indiquerait quelles modifications,
notamment d’épissage, sont à l’origine de la maladie. Parmi les moyens
d’étude de l’épissage, les puces à ADN
suscitent beaucoup d’enthousiasme. Sur
un support en verre, on dépose des
séquences d’ ADN connues qui sont
mises en contact avec des copies d’ADN,
dit complémentaire, des ARN messagers cellulaires. Ces copies sont marquées par des molécules fluorescentes,
aussi on identifie facilement les ARN cellulaires en analysant par un scanner la
fluorescence en chaque point de la puce.
L’inscription au répertoire
Ces techniques sont bien adaptées à
l’étude de variations quantitatives des
ARN messagers, mais, dans le cadre de
l’étude des épissages, on est confronté
à une situation difficile. En effet, avec
de telles puces, on cherche à suivre l’inclusion ou l’exclusion de certains exons
au sein de populations d’ARN messagers. Or, quand la séquence fixée sur
la puce correspond à celle d’un exon,
les ADN complémentaires qui s’y fixent
le contiennent toutes sans pour autant
être tous identiques : des ARN messagers différant par un autre exon que
celui fixé sur la puce ne sont pas distingués. En revanche, si les séquences,
à la surface de ces puces, correspondent
aux différentes jonctions possibles entre
les exons, on suivrait l’apparition de
nouvelles espèces d’ARN messagers qui
résultent de l’élimination de certains
exons lors des épissages alternatifs. Par
exemple, quand une protéine normale
est composée de tous les exons de l’ARN
prémessager, une protéine anormale
résultant de l’absence de l’exon 4 serait
© POUR LA SCIENCE - N° 296 JUIN 2002
296 - SCHWEIGHOFFER 03/05 14/05/02 12:42 Page 51 cla Maquettistes:cla(Celine Lapert):296 PLS:Flashage 296:296- SCHWEIGHOFFER:
détectée par la séquence de la jonction
entre l’exon 3 et l’exon 5.
Hélas, cette stratégie reste théorique, car le nombre de toutes les jonctions qui peuvent être créées par
l’épissage alternatif est très grand. De
plus, l’examen du génome ne permet
pas une prédiction suffisante de ces
jonctions, notamment des sites qui sont
démasqués lors de dysfonctionnement
des voies de signalisation.
À la recherche des jonctions
Une meilleure approche passe par
l’identification des gènes dont les ARN
messagers sont réorganisés à la suite
d’altérations du mécanisme d’épissage
alternatif dans des conditions pathologiques. Récemment, nous avons mis
au point une telle méthode, nommée
DATAS, afin d’identifier de façon systématique au sein d’une population d’ARN
messagers les différents événements
d’épissage qui coexistent dans deux
situations physiopathologiques ou bien,
à l’inverse, les distinguent.
Grâce à cette technique, on constitue
des banques d’exons et d’introns, grâce
auxquelles on identifie rapidement les
arrangements d’exons propres aux phénomènes étudiés et donc, les séquences
de jonction adaptées au suivi des maladies. Ainsi, dans une première étape,
les études des modifications de l’épissage qui caractérisent les différentes
étapes d’une maladie contribueraient à
l’obtention d’une image des variations
de l’expression génétique, et notamment
de l’épissage. On obtiendrait alors, dans
une seconde étape, de nouvelles
méthodes de diagnostic fondées sur les
modifications des protéines codées.
Par exemple, dans le cas des cancers, le
décryptage des ARN messagers issus
de l’épissage identifiera les domaines
modifiés des protéines membranaires
contre lesquels on développerait des anticorps spécifiques des cellules tumorales.
Fabien SCHWEIGHOFFER est directeur
général de la Société Exonhit, responsable
des programmes thérapeutiques.
Douglas BLACK, Protein Diversity from
Alternative Splicing : A Challenge for Bioinformatics and Post-Genome Biology, in
Cell, vol. 103, pp. 367–370, 2000.
Xuguang LI et al., Grb3-3 Is Up-regulated
in HIV-1-infected T-cells and Can Potentiate Cell Activation through NFATc, in The
Journal of Biological Chemistry, vol. 275,
2000.
© POUR LA SCIENCE - N° 296 JUIN 2002
Outre le diagnostic, les modifications
pathologiques d’épissage seront peutêtre utiles pour mettre au point des fragments de nucléotides spécifiques ou des
molécules qui agiront sur les cascades
enzymatiques qui les commandent.
L’identification des altérations, à la suite
de l’épissage, d’enzymes et de récepteurs constitue le premier pas du développement d’inhibiteurs efficaces.
La solution de l’épissage alternatif,
retenue par l’évolution, pour augmenter le nombre de protéines en maintenant constant le génome, est la clef
de la complexité des animaux supérieurs et de l’adaptation des cellules
aux différentes situations rencontrées.
Cette solution présente plusieurs avantages. Une autre solution aurait pu être
l’augmentation de la taille du génome :
cette stratégie aurait multiplié les
protéines, mais aussi le risque d’erreurs, car, lors de la réplication de
l’ADN, au moment de la division cellulaire, la fréquence de «fautes de
copie» est constante.
Toutefois, l’épissage alternatif n’est
pas la seule option retenue pour augmenter la diversité des protéines. La
protéolyse en est une autre : selon le
contexte cellulaire, un domaine d’une
protéine peut être découpé, conférant
ainsi de nouvelles propriétés à la protéine. Par exemple, les récepteurs,
tels ceux de l’hormone de croissance,
sont parfois rendus solubles après le
clivage de leur partie membranaire.
L’hormone circulante est toujours fixée,
mais l’information qu’elle véhicule
n’est plus transmise à l’intérieur des
cellules. Bien entendu, les mécanismes
de l’épissage alternatif et de la protéolyse sont différents, mais tous deux
sont complémentaires, l’un est en
amont, l’autre en aval de la synthèse
des protéines. Tous deux participent
à une adaptation très fine des cellules : 30 000 gènes pour une quasi-infinité de protéines.
Zhihong LIU et al., Structural Basis for
Recognition of the Intron Branch Site RNA
by Splicing Factor 1, in Science, vol. 294,
pp. 1098-1102, 2001.
Wolfgang E NARD et al., Intra- and
Interspecific Variation in Primate Gene
Expression Patterns, in Science, vol. 296,
pp. 340-343, 2002.
Eran MESHORER et al., Alternative Splicing and Neuritic mRNA Translocation Under
Long-Term Neuronal Hypersensitivity, in
Science, vol. 295, pp. 508-512, 2002.
51
Téléchargement