Module 4
La régulation de l'expression des gènes chez les eucaryotes
trouver l'information complémentaire?
MCB-10, 11; GVII-20, 21.
Tout comme pour les procaryotes, l'étape s'effectue la principale
source de régulation est l'initiation de la transcription. Nous avons vu
que chez les procaryotes, la majorité des opérons sont transcrits par
une seule ARN polymérase, associée au facteur σ70 et régulée par la
présence de répresseurs et d'activateurs liés à des sites très rapprochés
du site d'initiation de la transcription. Cette organisation convient par-
faitement au génome compact des bactéries, il y a peu de distance
entre les unités transcriptionnelles voisines. Chez les eucaryotes, nous
avons la situation inverse, les unités transcriptionnelles se retrou-
vent bien espacées les unes des autres dans le génome. De plus, à la
simplicité d'une seule ARN pol, les eucaryotes opposent trois ARN
polymérases qui transcriront les différents types d'ARN.
Les ARN polymérases eucaryotiques
La transcription dans une cellule eucaryotique est divisée en trois caté-
gories. Les gènes sont classés d'après leurs types de promoteur et
chaque classe est transcrite par une polymérase différente.
Chacune des ARN pol eucaryotiques est fort complexe. Les trois font plus de 500 000 Da en poids moléculaire
et contiennent 2 grosses sous-unités, possédant une certaine similitude de séquences avec les sous-unités βet
β' de l'ARN pol bactérienne, et entre 12 et 15 sous-unités de plus petite taille. Les ARN pol de la levure ont,
jusqu'à présent, été les mieux caractérisées et les autres ARN pol eucaryotiques sont fortement similaires à ces
dernières. La plus grosse sous-unité de l'ARN pol II possède une extrémité COOH-terminale spéciale. Elle con-
tient une "queue" composée d'une longue suite d'un heptapeptide de séquence consensus: Tyr-Ser-Pro-Thr-Ser-
Pro-Ser. Cette région est connue sous le nom de domaine carboxy-terminal (CTD en anglais). L'ARN pol II de
levure présente 26 de cet heptapeptide, alors que celle de
mammifère en contient 52. Cette extension spéciale est
importante pour l'épissage, l’initiation et la terminaison de la
transcription et la formation de l'extrémité 3' de l'ARNm
mature (voir Nature 385: 357-360, 1997).
1
© Daniel P. Matton, 2002
Cell 98: 1-4,1999.
ARN polymérase Localisation Gènes transcrits
ARN pol I Nucléole ARNr (28S, 18S, 5.8S)
ARN pol II Nucléoplasme ARNm (ARNhn), + 4 snARN
ARN pol III Nucléoplasme ARNt, snARN,
ARN 7S (SRP), ARNr 5S
La caractérisation des promoteurs: expression stable et transitoire
Avant d'entreprendre la description de l'architecture des promoteurs eucaryotiques (régions régulatrices se
trouvant généralement en amont de la séquence codant pour l'ARN), voyons brièvement comment nous pou-
vons déterminer résident les éléments de régulation cis sur lesquels se lieront les facteurs protéiques agis-
sant en trans. Les promoteurs seront caractérisés par des expériences de délétions, de mutations ponctuelles
et d'empreintes (footprinting). Nous avons vu dans le chapitre précédent comment nous pouvions, à l'aide de
l'ADNase I (DNase I), d'un fragment d'ADN marqué radioactivement et de facteurs transcriptionnels, déli-
miter la région couverte par un ou plusieurs facteurs. Les expériences de retard sur gel nous permettent aussi
de tester la présence de sites de liaisons sur un fragment d'ADN marqué radioactivement, de même que d'es-
timer l'affinité spécifique d'un facteur pour un site particulier. Voyons maintenant comment nous pouvons
définir opérationnellement les sites cis importants pour l'expression d'un gène donné. Les promoteurs seront
définis par leur capacité à initier la transcription d'un gène donné dans un système d'expression approprié.
Déterminer le site d'initiation de la transcription
Une condition préalable à l'analyse des régions régulatrices est de déterminer le site d'ini-
tiation de la transcription (+1). Sans cette connaissance, il est impossible de savoir
débute l'unité transcriptionnelle et se
terminent les régions régulatrices.
L'analyse des ARNm produit par l'ARN
pol II révéla que tous avaient une coiffe
en 5' (5' cap). La coiffe en 5' est formée
par l'ajout d'une 7-méthyl-guanosine
(m7G) dans une liaison inhabituelle
5'5' (fig. 4.18 MCB). La réaction
enzymatique de l'ajout de la coiffe ne
peut s'effectuer que sur un nucléotide triphosphate (ou diphosphate) et par conséquent
n'est possible que sur le premier nucléotide de la chaîne d'ARN. La maturation d'un pré-
cuseur d'ARN plus long pour donner un substrat à cette réaction est donc exlue. Le pre-
mier nucléotide de l'ARNm correspondra donc au nucléotide du site +1. Les techniques
d'extension d'amorce (primer extension), de cartographie par la nucléase S1 (S1 map-
ping) (fig. 7.35 MCB) permettent de cartographier le site d'initiation de la transcription.
Les systèmes d'expression transitoire
L'utilisation d'un système d'expression transitoire dépendra évidemment du type de travail effectué. Il serait par
exemple illusoire de vouloir définir les régions régulatrices du promoteur du gène de la Rubisco, impliqué dans
la photosynthèse et régulé par la présence de lumière dans un système de transfection de cellules de mam-
mifères en culture ou en injectant les constructions promoteur-gène rapporteur dans des oocytes de grenouilles
(même avec une grenouille verte!). Les systèmes d'expression transitoire les plus utilisés sont la microinjec-
tion, la transfection dans des cellules en culture, l'électroporation des cellules en culture et le bombarde-
ment de microparticules enrobées d'ADN (biolistique/particle bombardment, gene gun). Ces systèmes peu-
vent être assimilés à des systèmes in vivo, car la transcription sera effectuée dans un un noyau intact, à l'in-
térieur d'une cellule. À l'opposé, la transcription pourra s'effectuer dans un système in vitro plus ou moins
entièrement reconstitué à partir des composantes de base purifiées.
Les systèmes d'expression stable: les transgéniques
Une autre façon de déterminer la capacité d'un promoteur à initier la transcription est d'intégrer les construc-
tions dans le génome d'un organisme et de tester l'activité du gène dans un tissu donné. Ce type d'expression
se rapprochera le plus des conditions normales d'expression du gène à l'étude. Nous verrons plus en détail
2
© Daniel P. Matton, 2002
l'utilisation des animaux et des plantes transgéniques dans un module ultérieur.
Les expériences d'insertion et de délétion du promoteur
La clé de ce type d'expérience réside dans l'utilisation d'un gène rapporteur. Tout gène que l'on peut facilement
doser et qui est absent du type cellulaire que l'on veut tester peut faire un bon gène rapporteur. Ainsi la β-galac-
tosidase d'E. coli, capable d'hydrolyser un substrat chromogénique comme le X-gal, peut très bien servir de
gène rapporteur chez la vaste majorité des eucaryotes, car ceux-ci ne possèdent pas d'activité β-galactosidase
intrinsèque. Un autre exemple est le gène de la luciférase de la mouche à feu (Photynus pyralis). Il permet en
présence des substrats appropriés, une détection visuelle par l'émission de lumière. Chez les plantes, on utilise
surtout le gène rapporteur GUS (β-glucuronidase d'E. coli) qui, tout comme la β-galactosidase, permet une
détection colorimétrique. Une protéine récemment isolée de la méduse Aeqorea victoria, la GFP ou green flu-
orescent protein, est aussi de plus en plus utilisée comme marqueur car elle ne nécessite aucun substrats ou
cofacteurs, sauf l'oxygène.
La procédure habituelle est de construire un plasmide qui contiendra les régions régulatrices du gène à l'étude
fusionnées à un gène rapporteur, de façon à ce que les régions régulatrices contrôlent l'expression du gène rap-
porteur utilisé. Par la suite, l'objectif est de diminuer graduellement la taille du promoteur dans les construc-
tions utilisées, donc de faire une série de délétions du promoteur. En déterminant l'activité du gène rapporteur
dans les différentes constructions, on peut donc estimer le taux d'initiation de la transcription dirigée par le
promoteur complet ou tronqué et ainsi savoir quelles sont les régions qui modulent la transcription (fig. 10.24
MCB). Le remplacement de blocs d'ADN (linker scanning mutations) dans un promoteur permet aussi la car-
actérisation des éléments impliqués dans la régulation
(10.31 MCB). Dans ce cas, il s'agit de remplacer de
courts blocs de séquences par des séquences dif-
férentes et d'en tester l'impact sur la régulation du
gène.
3
© Daniel P. Matton, 2002
Lac Z
Lac Z
Lac Z
Lac Z
Lac Z
-1000
-500
-250
-100
-50
-10
Lac Z
Activité
ββ-galactosidase
++++
-
++++++
++++++
+
Avec lumière
Sans lumière
++
++
++
+
++++
-
+1
ATG
-500
-250
Élément de
réponse à la
lumière
-250
-100
Activateur
général
-50
-10
Élément
essentiel à la
transcription
TATAA
Analyse du promoteur
-50
-100
Silenceur
Dans cette série progressive de délétion on remarque que
certaine régions sont importantes pour la régulation tant
positive que négative du gène à l’étude.
Lac Z
Lac Z
-500
-250
Activité
ββ-galactosidase
++++++
Avec lumière
Sans lumière
++
++
+1
ATG
-500
-250
Élément de
réponse à la
lumière
Analyse du promoteur
Silenceur
Lac Z
+
-200
Lac Z
++++
+
-200
Lac Z
+
-200
Lac Z
-
-200
-50
Lac Z
+
-200
Promoteur à l’étude
Promoteur hétérologue
TATA
Gène rapporteur
Lac Z
Lac Z
-100
-50
++++
+
+
++++
-100
Une fois les régions cis de régulation caractérisées par
délétion du promoteur, on peut prouver leur rôle par des
expériences de fusion et de remplacement dans un pro-
moteur hétérologue, n’étant à l’origine pas soumis au
même type de régulation.
La caractérisation fine des séquences d'ADN impliquées dans la liaison aux facteurs transcriptionnels sera exé-
cutée par différentes méthodes dont la production de mutations ponctuelles dans la région ayant démontré de
l'affinité pour un facteur transcriptionnel et/ou ayant démontré son effet sur la transcription dans une expéri-
ence de délétion et d'insertion. La mutagénèse dirigée, de même que le PCR recombinant, sont les deux
méthodes de choix pour introduire des mutations ponctuelles dans une séquence donnée. Nous verrons ces
deux méthodes dans le module sur les techniques avancées de l’ADN recombinant.
La transcription par l'ARN polymérase I
L'ARN pol I n'est utilisée que pour la transcription des ARNr, produits initialement sous la forme d'un transcrit
primaire, le pré-ARNr qui devra être maturé en ARNr 18S, 28S et 5.8S. Par conséquent, les promoteurs de ces
gènes d'ARNr seront les moins compliqués. C’est dans les cellules humaines que les promoteurs d’ARNr sont
le mieux caractérisés. La structure du promoteur des gènes d'ARNr est bipartite: elle ne contient que deux
régions importantes pour initier la transcription: l'élément central (core element) et l'élément UCE (upstream
control element). L'élément central est essentiel à la transcription et englobe le site d'initiation de la transcrip-
tion. L'élément UCE est situé à -100 et stimule la transcription de 10 à 100 fois (fig. 10.69a MCB). Un fac-
teur transcriptionnel nommé UBF (upstream binding factor) a été caractérisé par son affinité pour l'UCE. La
protéine UBF a aussi de l'affinité pour l'élément central, ces deux régions sont riches en G:C et sont similaires
à 85%. Un complexe nommé SL1 (selectivity factor 1) composé de 4 protéines dont TBP (TATA-binding pro-
tein, aussi impliqué dans la transcription par les ARN pol II et III) et 3 facteurs associés TAF1 (TBP-associat-
ed factors) sont nécesaires à la stabilisation du complexe et permet, une fois associés, la liaison de l'ARN pol
I.
Il est à noter que toute protéine qui est nécessaire
pour l'initiation de la transcription, sans faire partie
du complexe de l'ARN polymérase, est un facteur
transcriptionnel.
La transcription par l'ARN polymérase III
Les gènes transcrits par l'ARN pol III incluent les
ARNt, l'ARNr 5S associé à la grosse sous-unité
ribosomale, l'un des petits ARN nucléaire néces-
saires à l'épissage des introns (snARN) ainsi que
l'ARN 7S associé à la SRP (signal recognition par-
ticle) impliquée dans la reconnaissance de la
séquence sig-
nal (peptide signal) des protéines sécrétées. Les promoteurs des gènes
transcrits par l'ARN pol III se divisent en 2 catégories qui seront reconnues
par des groupes différents de facteurs protéiques. Les promoteurs des
gènes de l'ARNr 5S, ainsi que des ARNt, sont internes, i.e. situés à l'in-
térieur de l'unité transcriptionnelle, donc en 3' du site d'initiation de la
transcription (fig. 10.69b, c MCB). Les promoteurs des gènes des snARN
se retrouvent en 5' du site +1, donc en position "normale" ou habituelle des
promoteurs. Pour la transcription des ARNt, deux régions de contrôle ont
été caractérisées. Ces régions correspondent aux régions les mieux con-
servées des ARNt, soient les boucles D et TYCG (fig. 4.26a MCB).
4
© Daniel P. Matton, 2002
Fig. 10.69 MCB
La transcription par l'ARN polymérase II
Les régions cis impliquées dans la liaison de l'ARN pol II
Dans beaucoup de gènes, la comparaison des séquences immédiatement en amont du site +1 a permis, tout
comme pour les promoteurs procaryotiques, de déterminer la présence de régions fortement conservées dont
l'alignement révèle la présence de séquences consensus. Généralement positionnée à -25/-35, on retrouve la
boîte TATA (fig. 10.30 BMC). Cette région est importante pour déterminer la position du site d'initiation de la
transcription. Le déplacement de la boîte TATA aura un effet direct sur la sélection du site +1. Des mutations
dans la boîte TATA auront un effet sur le taux d'ini-
tiation de la transcription, alors que des mutations
entre la boîte TATA et le site +1 n'auront peu ou pas
d'effet (fig. 20.16 GVII). Chez la levure, on retrou-
ve aussi une boîte TATA mais elle est généralement
positionnée à -100.
Au lieu d'une boîte TATA, certains promoteurs contiendront un autre élément appelé initiateur (ou élément
enclencheur). La plupart des éléments initiateurs ont une cytosine en -1 et une adénine en +1. Les séquences
d' ADN dans le voisinage immédiat du site +1 déterminent généralement la force de ce type de promoteur.
La transcription des gènes comportant soit une boîte TATA, soit un site initiateur, soit les deux, débute donc en
un endroit précis. À l'opposé, certains gènes ne contenant ni initiateur ni boîte TATA, auront des sites d'initia-
tion multiples. La plupart des gènes de cette catégorie contiennent une région riche en GC de 20 à 50 pb située
à l'intérieur des premiers 100 à 200 pb en amont du site +1. Ces régions sont aussi appelées ilots CpG (CpG
islands), car ils se retrouvent généralement à l'intérieur d'une région de nucléotides sous-représentés en GC. Le
génome des vertébrés est lui-même sous-représenté en dinucléotides GC. La présence de régions riches en GC
correspond donc à une répartition non-aléatoire et pourra signaler la présence d'un promoteur.
Les expériences de délétion et d'insertion dans les promoteurs ont permis de démontrer la présence d'éléments
cis de régulation tant dans des régions proximales au site +1 que distales. Les éléments retrouvés à l'intérieur
des premiers 100-200 pb en amont du site +1 sont dits éléments proximaux du promoteur (promoter-proximal
elements). Ces éléments détermineront non seulement le taux de transcription, mais auront parfois un effet sur
la spécificité tissulaire de l'expression.
Une autre région fréquemment retrouvée dans les promoteurs est la boîte CAAT située à -80. Cette boîte peut
fonctionner indépendamment de son orientation et la mutagénèse des nucléotides de la boîte CAAT a permis
de démontrer que la boîte CAAT influençait le taux de transcription (fig. 20.16 GVII). Cette région de séquence
consensus GGCCAATCT est liée par des facteurs transcriptionnels de la famille CTF. Un autre élément fonc-
tionnant indépendamment de son orientation, la boîte GC (GGGCGG) reconnue par le facteur SP1, est aussi
fréquemment retrouvée dans les promoteurs de gènes de mammifères. Nous voyons donc ici une propriété fon-
damentale des promoteurs eucaryotiques, soit l'aspect modulaire de leur architecture.
Les éléments distaux du promoteurs
Les enhancers (ou amplificateurs) sont des séquences d'ADN auxquelles se lient divers facteurs transcription-
nels, qui sont capables d'augmenter le taux de transcription d'un gène même lorsque positionnées à distance
(même à des kilobases), tant en 5' qu'en 3' et qui fonctionnent indépendamment de leur orientation. On peut
aussi les retrouver à l'intérieur d'un intron. Les enhancers peuvent stimuler la transcription de presque n'importe
quel promoteur placé dans le voisinage de l'enhancer. Chez la levure, des éléments similaires aux enhancers
appelés UAS pour upstream activating sequences, ont aussi été caractérisés. À la différence des vrais
5
© Daniel P. Matton, 2002
1 / 13 100%