Web 13 Fiche 13.1 MÉCANISMES D’ACTIVATION DE LA TRANSCRIPTION PAR L’ACTIVATEUR CRP-AMPC C. Guterriez La protéine Crp (Cyclic-AMP-receptor-protein), également appelée Cap (Catabolite Activator Protein) comprend 209 acides aminés (23 kDa), et est le produit du gène crp chez la bactérie Escherichia coli. La protéine Crp forme des homo-dimères en solution. La structure cristallographique de ces dimères a été résolue, en présence comme en absence de l’effecteur AMPc. Chaque monomère se divise en deux domaines. Le domaine N-terminal (acides aminés 1 à 139) est responsable de la dimérisation de Crp et de la fixation de l’AMPc, au sein d’une poche de fixation présente sur chaque monomère. Cette fixation provoque un changement de conformation des monomères de Crp, les rendant aptes à se fixer sur leurs cibles sur l’ADN. Le domaine C-terminal de Crp (acides aminés 140 à 209) est responsable de la fixation à l’ADN, grâce à un motif hélice-tour-hélice, qui permet l’interaction avec un site spécifique sur l’ADN. Ce site de fixation est une séquence semi-palindromique de 22 paires de bases, dont la séquence consensus est 5’-AAATGTGATCTAGATCACATTT-3’. Chaque monomère d’un dimère de Crp-AMPc se fixe sur un demi-site de fixation, et la fixation du dimère introduit une courbure de la molécule d’ADN d’environ 80°, conduisant l’ADN à partiellement envelopper le dimère de Crp-AMPc. 1 LES PROMOTEURS CIBLES DE CRP-AMPC Crp-AMPc est capable d’activer la transcription au niveau d’une centaine de promoteurs chez la bactérie E. coli. Une analyse détaillée de plusieurs de ces promoteurs a montré qu’il est possible de les regrouper en trois classes distinctes : Classe I Ces promoteurs sont activés uniquement par Crp-AMPc, suite à la fixation sur un site unique situé en amont du promoteur et sur la même face de la double hélice d’ADN que celle sur laquelle se fixe l’ARN polymérase. En conséquence, les sites de fixation de Crp-AMPc peuvent se retrouver centrés sur les positions -93, -83, -72 ou encore -62, par rapport au site de démarrage de la transcription. Un des exemples les mieux décrits est le promoteur de l’opéron lactose, au niveau duquel le site de fixation du complexe Crp-AMPc est centré sur la position 61,5. Classe II Les promoteurs de cette classe sont également activés uniquement par Crp-AMPc et via la fixation à un seul site sur l’ADN. Toutefois, ce site se trouve chevaucher l’élément -35 du promoteur. Ainsi, dans le promoteur galP1, le mieux connu de cette classe, le site de fixation de Crp-AMPc est centré sur la position -41,5. Classe III Cette classe est plus hétérogène. Elle regroupe des promoteurs au niveau desquels l’activation met en œuvre plusieurs dimères de Crp-AMPc et/ou au moins un autre régulateur en plus de Crp-AMPc, conduisant à des interactions plus complexes entre ces régulateurs afin d’activer le démarrage de la transcription. MÉCANISME DE L’ACTIVATION AU NIVEAU DES PROMOTEURS DE CLASSE I (FIGURE F13.1-1) Des « mutants d’activation » de crp ont pu être isolés chez E. coli. Il s’agit d’allèles mutés produisant des variants de Crp toujours capables de fixer l’AMPc , de dimériser et de reconnaître le site de fixation sur l’ADN, mais devenus incapables d’y activer la transcription. Ces mutants ont mis en évidence une région d’activation, AR1 (Activating region 1) composée des acides aminés 156 à 164 de Crp. Dans la structure des complexes ADN-Crp-AMPc, la région AR1 se trouve à la surface des monomères de Crp, orientée vers l’extérieur des complexes. Des expériences particulièrement élégantes ont permis de montrer que les deux monomères de Crp-AMPc ne jouent pas un rôle symétrique dans le processus d’activation. On disposait de mutations altérant le motif hélice-tour-hélice et changeant la spécificité de reconnaissance de l’ADN. Ainsi, les monomères de Crp portant la séquence sauvage ou modifiée reconnaissent des sites de fixation à l’ADN légèrement différents. Une combinatoire de mutations des motifs hélice-tour-hélice et des altérations sur chaque demi-site sur l’ADN ont 2 alors permis de construire des « hétérodimères orientés » dans lesquels une altération de la région AR1 était présente soit sur le monomère le plus amont, soit sur celui fixé du côté aval. Ces expériences ont établi que seul le monomère situé en aval doit porter une région AR1 intacte pour que l’activation ait lieu. L’activation des promoteurs de classe I nécessite par ailleurs la présence de la région Cterminale, CTD (C-terminal domain) sur au moins l’une des deux sous-unités de l’ARN polymérase. De plus il a été possible d’isoler des « mutants d’activation » produisant des sousunités modifiées de l’ARN polymérase dans lesquels les complexes Crp-AMPc ne sont plus capables d’activer la transcription au promoteur lac. Ces mutations changent spécifiquement des acides aminés de la région CTD. L’activation au niveau des promoteurs de classe I s’explique alors parce que la fixation de Crp-AMPc apporte une interface de contact avec l’ARN polymérase, augmentant l’affinité de cette dernière avec les régions promotrices dans les complexes ternaires ADN, Crp-AMPc et ARN polymérase. La présence d’une région non structurée et particulièrement flexible entre les domaines N- et C-terminaux des sous-unités permet à ces dernières une souplesse suffisante pour interagir avec les régions AR1 des monomères avals de Crp sur des sites centrés en -93, 83, -72 ou bien -62. Figure F13.1-1. Mécanisme de l’activation de la transcription par Crp-AMPc au niveau des promoteurs de classe I (A) ou II (B). 3 MÉCANISME DE L’ACTIVATION AU NIVEAU DES PROMOTEURS DE CLASSE II Les promoteurs de la classe II activés par Crp-AMPc ont un élément -35 éloigné du consensus et ils présentent un site de fixation des complexes Crp-AMPc chevauchant avec cette région. Des études génétiques et biochimiques du même type que celles décrites pour les promoteurs de classe I ont établi que deux sites à la surface de la protéine Crp sont nécessaires pour l’activation. Comme pour les promoteurs de classe I, le site AR1 est impliqué. Toutefois, c’est le site présent sur le monomère situé le plus en amont qui est mis en jeu. Ce site, en interagissant avec le domaine CTD d’au moins une des sous-unités , permet d’améliorer la fixation de l’ARN polymérase. D’autre part, un second site, AR2, constitué des acides aminés 19 à 21 et 101, est lui aussi nécessaire pour l’activation des promoteurs de classe II. Des mutations modifiant les acides aminés de ce site affectent l’activation des promoteurs de classe II, mais pas celle des promoteurs de classe I. Le site AR2 du monomère situé le plus en aval sur le site de fixation de Crp-AMPc est en interaction avec le domaine NTD d’une sous-unité au moins. Cette seconde interaction semble agir sur une étape du démarrage de la transcription postérieure à la fixation de l’ARN polymérase, lors de l’isomérisation des complexes fermés en complexes ouverts. MÉCANISME DE L’ACTIVATION AU NIVEAU DES PROMOTEURS DE CLASSE III Parmi les promoteurs de classe III activés par Crp-AMPc, on distingue plusieurs sous-classes. Certains portent plusieurs sites de fixation des dimères de Crp-AMPc. Ils présentent un fonctionnement synergique de ces dimères, avec par exemple l’addition de deux dimères fixés en positions -93 et -62 agissant chacun par le mécanisme décrit pour les promoteurs de classe I. On peut également observer des dimères fixés en des sites à -83 et -42, pour lesquels le plus amont fonctionne par un mécanisme de type I alors que le plus en aval utilise un mécanisme de type II. Pour ces promoteurs, il semble donc que l’addition de plusieurs sites de fixation aboutisse à une addition des effets sur chacun de ces sites. Une seconde sous-classe comprend des promoteurs sur lesquels Crp-AMPc agit en collaboration avec d’autres régulateurs. Ici également, on observe une synergie entre CrpAMPc, agissant via un mécanisme de type I ou II selon la position de son site de fixation, et un second régulateur. Ce dernier peut stimuler soit la fixation de l’ARN polymérase soit les étapes d’isomérisation des complexes fermés, selon des mécanismes qui lui sont propres et via des contacts régulateur-ARN polymérase spécifiques et différents de ceux mis en œuvre par CrpAMPc. Une particularité notable de l’activation à ces promoteurs est que Crp-AMPc ne contacte pas le second régulateur, et que la synergie découle d’interactions avec les sous-unités de l’ARN polymérase. Enfin, une dernière sous-classe comprend des promoteurs sur lesquels l’action de Crp-AMPc ne passe pas par une interaction avec l’ARN polymérase. C'est le cas pour le promoteur de l’opéron malEFG. L’activateur MalT peut occuper deux types de sites différents, sur lesquels MalT est capable ou pas de stimuler la transcription. En absence de Crp-AMPc, MalT occupe les sites non-activateurs. Le rôle de Crp-AMPc, en se fixant sur son site en amont du promoteur 4 est alors de repositionner l’activateur MalT sur les sites activant la transcription. Sur de tels promoteurs, les régions d’activation AR1 ou AR2 ne sont pas mises en jeu, et seule la fixation des dimères de Crp-AMPc est importante pour l’activation. Bibliographie Busby S. & Ebright R. 1999. Transcription Activation by Catabolite Activator Protein (CAP). J. Mol. Biol. 293:199-213 Lawson C. Swigon D., Murakami K.S., Darst S.A., Berlman H.M., Ebright R.H.l. 2004. Catabolite Activator Protein: DNA Binding and Transcription Activation. Curr. Opin. Structural Biol. 14 h :10-20 5 Web 13 Fiche 13.2 CONTRÔLE DE LA STABILITÉ DES FACTEURS H ET E CHEZ ESCHERICHIA COLI C. Guterriez Lorsque les cellules bactériennes sont soumises à une augmentation brutale de la température, elles déclenchent un programme génétique, appelé la réponse au choc thermique. Une conséquence majeure des chocs thermiques est de conduire à l’accumulation de protéines partiellement ou totalement mal conformées dans tous les compartiments de la cellule. Chez E. coli comme chez de nombreuses autres bactéries, deux grands régulons sont induits de façon transitoire lors d’un choc thermique. Ils sont contrôlés respectivement par deux facteurs sigma alternatifs, H (ou 32) d’une part et E (ou 24) d’autre part. Parmi les produits des membres de ces régulons on trouve plusieurs chaperons moléculaires, chargés d’aider au bon repliement des protéines, ainsi que des protéases capables d’éliminer les protéines mal conformées. Le régulon H est impliqué dans la prise en charge des protéines mal conformées au niveau du cytoplasme. Pour sa part, le régulon E comprend des chaperons périplasmiques ainsi que des protéases membranaires ou périplasmiques, et son rôle est de prendre en charge les protéines mal conformées dans le compartiment extra-cytoplasmique (périplasme ou membrane externe). CONTRÔLE DE L’ACTIVITÉ DU FACTEUR H H (produit du gène rpoH) est soumis à un contrôle complexe jouant à la fois sur sa synthèse et sa stabilité. rpoH est transcrit depuis 5 promoteurs différents, dont un dépend deE, assurant une connexion entre les régulons des deux facteurs sigma. La traduction du messager de rpoH est sensible à la température. En effet, deux éléments de séquence dans l’ARNm de rpoH forment une structure secondaire inhibant la traduction à température normale et la destruction 6 spontanée de cette structure à forte température autorise la traduction. L’ARNm de rpoH se comporte donc comme un ARN thermosenseur. Un second mécanisme s’ajoute au contrôle traductionnel pour réguler l’activité de H (fig. F13.2-1). Figure F13.2-1. Contrôle de l’activité et de la stabilité du facteur H. Les protéines chaperons cytoplasmiques DnaKJ/GrpE et GroEL/ES sont capables d’interagir avec H ce qui a pour effet d’une part de l’inactiver et d’autre part de favoriser sa dégradation par une protéase intrinsèque de la membrane cytoplasmique, FtsH. Un acteur supplémentaire est nécessaire pour conduire à cette dégradation : le complexe nucléoprotéique SRP (Signal Recognition Particle). Formé d’une protéine, Ffh, complexée à un petit ARN, l’ARN 4,5S, SRP est une machinerie d’adressage à la membrane cytoplasmique des protéines en cours de traduction qui doivent être sécrétées ou insérées dans la membrane. La particule SRP est capable de se lier à H, et de la maintenir au niveau de la membrane cytoplasmique, via son interaction avec le récepteur à SRP, la protéine intégrale de membrane FtsY. Là, H est présenté à la protéase FtsH qui assure sa dégradation. C’est grâce à ces mécanismes que l’inactivation et la dégradation de H sont modulées en réponse à la présence de protéines mal conformées dans le cytoplasme. En effet, les chaperons cytoplasmiques sont présents en quantité limitante et, suite à un choc thermique, l’augmentation de protéines mal conformées dans le cytoplasme va 7 titrer ces protéines chaperons, les détournant de leur action sur H qui se retrouve ainsi à la fois stabilisée et active. Comme les gènes codant les chaperons cytoplasmiques font partie du régulon H, dès qu’une quantité de chaperons suffisante pour déstabiliser et inactiver H sera atteinte l’activité de H va rapidement diminuer, et le régulon H va de nouveau être très peu exprimé. C’est ce mécanisme de fermeture qui fait que l’induction de la réponse au choc thermique est seulement temporaire à la suite d’un choc thermique. CONTRÔLE DE L’ACTIVITÉ DU FACTEUR E Pour sa part, le facteur E n’est pas régulé au niveau de sa production, mais de son activité. Le gène rpoE forme un opéron avec trois autres gènes rseA, rseB et rseC. RseA et RseB sont deux protéines régulant négativement l’activité de E. En absence de stress, lorsqu’il n’y a pas de protéines mal conformées dans le périplasme, E est séquestré au niveau de la membrane cytoplasmique par une interaction avec la protéine RseA, qui a donc une activité de type anti- (fig. F13.2-2A). RseA présente un domaine cytoplasmique, un segment transmembranaire et un domaine périplasmique. Une seconde protéine, RseB, interagit avec le domaine périplasmique de RseA, et augmente l’affinité de RseA pour E. La séquestration de E par RseA l’empêche de former des holoenzymes E-E avec l’ARN polymérase enzyme cœur, et le régulon E n’est donc pas exprimé. Les deux autres acteurs de ces régulations, les protéases DegS et RseP sont inactives. En revanche, en présence de protéines mal conformées dans le périplasme, par exemple suite à un choc thermique, une cascade de dégradations protéolytiques est amorcée dans le périplasme qui va aboutir à la libération de E dans le cytoplasme (fig. F13.2-2B). Les extrémités C-terminales de porines de membrane externe (OMP), normalement non exposées, deviennent accessibles sur les protéines mal conformées. Ces extrémités peuvent interagir avec la protéase associée à la membrane DegS, du côté périplasmique, et l’activer. DegS peut alors cliver le domaine périplasmique de RseA. Ce clivage est aussi rendu plus efficace par le décrochage de RseB, lorsqu’elle aussi interagit avec des protéines mal conformées (probablement des lipoprotéines) dans le périplasme. Une seconde protéase membranaire, RseP, peut ensuite cliver RseA au niveau de son segment transmembranaire, libérant dans le cytoplasme le domaine cytoplasmique de RseA (RseA-cyto) lié à E. Enfin, une troisième protéase, localisée dans le cytoplasme, ClpXP, assure la dégradation de RseA-cyto, libérant E qui peut former des holoenzymes E-E et transcrire ses gènes cibles. Le régulon E est ainsi induit par l’apparition de protéines mal conformées dans le périplasme. Comme pour l’induction du régulon H, le système est programmé pour se refermer. En effet, d’une part des gènes du régulon produisent des chaperons et des protéases périplasmiques qui vont prendre en charge les protéines mal conformées dans le périplasme, et donc stopper le signal inducteur. D’autre part, l’opéron rpoE-rseA-rseB-rseC fait lui-même partie du régulon, et l’induction restaure la production de l’anti- RseA et son partenaire RseB, afin de remettre en place la séquestration, et d’arrêter l’induction. 8 Figure F13.2-2. Contrôle de l’activité du facteurE. A. En absence de signal inducteur, la protéine E est séquestrée au niveau de la membrane cytoplasmique par l’anti- RseA. B. En présence de protéines mal conformées dans le périplasme, une cascade de dégradations protéolytiques est enclenchée, qui libère E. L’ensemble des mécanismes contrôlant E permet de transmettre à travers la membrane cytoplasmique un signal généré et perçu dans le périplasme, jusqu’au cytoplasme où la réponse régulatrice va s’exercer. Ce type de voie de régulation utilisant des cascades de protéases membranaires a été nommé protéolyse intramembranaire régulée. Découvert initialement chez les eucaryotes pour le contrôle des gènes de biosynthèse du cholestérol, il a été trouvé également chez d’autres bactéries, comme Bacillus subtilis où il participe à la régulation de la cascade de facteurs sigma régulant la sporulation. 9 Bibliographie Ades S. 2008. Regulation by Destruction: Design of the E Envelope Stress Response. Curr. Opin. Microbiol. 11: 535-540 Guo M. & Gross C. 2014. Stress-Induced Remodeling of the Bacterial Proteome. Current Biology 24-R: 424–R434 Lim B., Miyazaki R., Neher S., Siegele D.A., ito K., Walter P., Akiyama Y., Yura T., Gross C.A. 2013. Heat-shock Transcription Factor 32 co-opts the Signal Recognition Particle to Regulate Protein Homeostasis in E. coli. PloS. Biol. 11: e1001735 10