Les facteurs de transcription - Atlas of Genetics and Cytogenetics in

publicité
Les facteurs de transcription
Page 1 sur 4
Atlas of Genetics and Cytogenetics in Oncology and Haematology
Les facteurs de transcription
*
I Introduction
II Initiation de la transcription
III Les différentes familles de facteurs de transcription
III.1 La famille Hélice-Tour-Hélice
III.2 La famille de protéines à doigts de zinc
III.3 La famille des facteurs à glissière à leucine
III.4 La famille Hélice-Boucle-Hélice
*
I Introduction
Chez les eucaryotes, il existe trois différentes ARN polymérases (ARN pol). Chacune de ces ARN pol est responsable de la transcription d’un
type d’ARN : l’ARN pol I transcrit les ARN ribosomiques (ARNr) ; l’ARN pol II transcrit les ARN messagers (ARNm) ; enfin, l’ARN pol III transcrit
les ARN de transfert et les petits ARN (ARNt). Toute protéine nécessaire à l’initiation de la transcription est définie comme un facteur de
transcription. Plusieurs facteurs de transcription agissent en reconnaissant directement des séquences cis-régulatrices au niveau des régions
promotrices des gènes. Cependant, la liaison à l’ADN n’est pas toujours requise pour l’action d’un facteur de transcription. Un facteur de
transcription peut ainsi reconnaître un autre facteur de transcription qui lui lie l’ADN directement, ou bien reconnaître directement l’ARN
polymérase.
Les facteurs de transcription reconnaissent généralement des petites séquences d’ADN conservées contenues au niveau des promoteurs de
leurs gènes cibles. Certains de ces facteurs et de ces séquences sont communs à plusieurs gènes et utilisés de manière constitutive, et
d’autres sont spécifiques de gènes et leur activité est régulée.
Les facteurs de transcription qui coopèrent avec l’ARN polymérase peuvent êtres divisés en trois groupes :
z
z
z
Les facteurs généraux de transcription, qui sont nécessaires à l’initiation de la synthèse de l’ARN au niveau des gènes de classe II
(gènes codants pour des protéines). Ils forment avec l’ARN pol II un complexe au niveau du site d’initiation de la transcription et
déterminent ainsi le site de démarrage de la transcription ; ce complexe est appelé complexe basal de transcription.
Les facteurs de transcription généraux et spécifiques de séquence, qui reconnaissent des petites séquences d’ADN localisées en
amont du site de démarrage de la transcription (comme le facteur SP-1 qui reconnaît les boîtes GC). Ces facteurs sont ubiquitaires, ils
augmentent l’efficacité de la transcription des gènes contenant les boîtes GC dans leurs promoteurs.
Les facteurs de transcription spécifiques de séquence et inductibles, qui possèdent un rôle régulateur. Ils sont synthétisés ou activés
d’une manière spécifique de tissu. Les séquences qu’ils reconnaissent sont appelées les éléments de réponse.
II Initiation de la transcription
L’ARN polymérase II ne peut pas initier la transcription par elle-même, pour cela, elle est dépendante de facteurs auxiliaires (appelés TFIIX, où
X est une lettre identifiant des facteurs individuels). L’ARN pol II et ces facteurs auxiliaires constituent ensemble la machinerie transcriptionnelle
de base qui est nécessaire à la transcription de tous les gènes de classe II (Figure 1).
L’efficacité et la spécificité avec lesquelles un promoteur de classe II est reconnu dépendent de petites séquences d’ADN, en amont de la boîte
TATA, ces séquences sont reconnues par les facteurs de transactivateurs ou inductibles. C’est le cas par exemple des boîtes CAAT, qui jouent
un rôle important dans la détermination de l’efficacité d’un promoteur, et elle est reconnue sur différents promoteurs par différents facteurs,
comme les facteurs de la famille CTF, les facteurs CP1 et CP2, ou les facteurs C/EBP et ACF. Ces différents facteurs ont également la
capacité d’interagir entre eux. La présence de ces facteurs sur un promoteur détermine le taux de transcription du gène cible.
http://www.infobiogen.fr/services/chromcancer/IntroItems/TFactorsFr.html
20/02/2006
Les facteurs de transcription
Page 2 sur 4
Figure 1: Modèle schématique d’assemblage de la machinerie basale de transcription
Une succession d’étapes met en jeu des éléments du promoteur, l’ARN polymérase II et des facteurs généraux de la
transcription. La première étape est constituée par la fixation du facteur de transcription TFIID sur la boîte TATA. Le
facteur TFIIA stabilise l’association TFIID/boîte TATA. Puis le facteur TFIIB se fixe sur le facteur TFIID fixé sur la boîte
TATA. TFIIB recrute l’ARN polymérase II et le facteur TFIIF. Les facteurs TFIIE et TFII H se fixent, suivis par des
facteurs supplémentaires complétant le complexe de transcription: Le facteur TFIIH présente une activité protéine
kinase. Une phosphorylation de l’ARN polymérase est réalisée sur la plus grosse sous-unité de l’enzyme riche en
sérine et en thréonine (partie C-terminale). La phosphorylation sur sites spécifiques déclenche le début de la
transcription: De plus, arrivée au bout du promoteur, l’ARN polymérase II doit être libérée du complexe des facteurs de
transcription généraux pour démarrer la transcription. La phosphorylation d’une des sous-unités de l’ARN polymérase
est indispensable pour déplacer l’enzyme du complexe d’initiation de la transcription.
III Les différentes familles de facteurs de transcription
Les facteurs de transcription dits trans-régulateurs sont des protéines particulières produites par d’autres gènes. Ces protéines présentent des
caractéristiques structurales communes, avec au moins au minimum deux domaines:
z
z
z
Un domaine de fixation à l’ADN : Des motifs structuraux particuliers ont été décrits avec : les homéodomaines, les domaines dits à “
doigts de zinc ”, les glissières à leucine. (Voir plus bas) ;
Un autre domaine, dit d’action sur la transcription. On rencontre différents types de domaines d’activation de la transcription. Des
domaines riches en glutamine, des domaines riches en proline et des domaines organisés en hélice alpha riches en résidus à charge
négative (hélice alpha acide) ;
Certains facteurs trans-régulateurs possèdent un troisième domaine qui permet de fixer un élément annexe permettant de réaliser
l’action d’un message extérieur à la cellule, comme un message hormonal. On a pu ainsi définir la superfamille des récepteurs
nucléaires (stéroïdes, vitamines D, hormones thyroïdiennes, acides rétinoïques, acides gras polyinsaturés...). Enfin, l’action des
facteurs trans-activateur peut être elle-même régulée par d’autres facteurs avec modification des facteurs trans en réponse à une
stimulation extérieure: phosphorylation, protéolyse etc...
Plusieurs familles de facteurs de transcription ont été ainsi définies selon les domaines de liaison à l’ADN utilisés.
III.1 La famille Hélice-Tour-Hélice
Le motif hélice-tour-hélice a été identifié dans un premier temps comme le domaine de liaison à l’ADN de répresseurs de phages. Mais une
forme similaire à ce domaine a été ensuite retrouvée dans les homéodomaines, une séquence caractérisée sur plusieurs protéines impliquées
dans la régulation du développement de la Drosophile ; elle existe aussi dans plusieurs facteurs de transcription de mammifères. Le domaine
homeobox est une séquence de 60 acides aminés, responsable de la liaison à l’ADN de manière spécifique de séquence. La partie C-terminale
de ce domaine comporte une forte homologie avec des protéines procaryotes à domaine hélice-tour-hélice.
III.2 La famille de protéines à doigts de zinc
Ce type de protéines comporte des éléments répétitifs avec une forme de doigts de gant. On peut retrouver de nombreux doigts. Ainsi, la
protéine Sp1 qui se fixe sur les boîtes GC possède trois doigts de zinc. L’ion Zn2+ sert à stabiliser le motif sous forme de doigt.
http://www.infobiogen.fr/services/chromcancer/IntroItems/TFactorsFr.html
20/02/2006
Les facteurs de transcription
Page 3 sur 4
Le motif à doigts de zinc comprend le domaine de liaison à l’ADN. Il a été caractérisé dans un premier temps sur le facteur TFIIIA, qui est
nécessaire à la transcription des gènes ARNr 5S par l’ARN pol III. Ces protéines tirent leur nom de leur structure, dans laquelle un groupe
d’acides aminés conservés lient un ion de zinc. Deux sous-familles de ces protéines sont connues : la famille classique à doigts de zinc et la
famille des récepteurs nucléaires.
Une protéine à doigt de zinc comporte typiquement une série de doigts de zinc, dont la séquence consensus pour un doigt est la suivante :
Cys-X2-4-Cys-X3-Phe-X3-Leu-X2-His-X3-His
Le motif tire son nom de la boucle d’acides aminés qui dépasse du site de liaison de l’ion zinc et est décrit comme le doigt Cys2/His2 (Figure
2).
Figure 2: Une série de trois doigts de zinc (exemple le facteur SP1)A.
Les doigts sont généralement organisés comme une série de répétitions en tandem allant jusqu’à 9 répétitions qui occupent toute la protéine
(comme TFIIIA). Le facteur de transcription général SP1 contient 3 doigts de zinc. La partie C-terminale de chaque doigt de zinc forme des
hélices a qui lient l’ADN, et la partie N-terminale forme des feuillets b. La partie non conservée en C-terminal de chaque doigt est responsable
de la reconnaissance spécifique de séquences d’ADN au niveau des gènes cibles.
Les récepteurs stéroidiens, qui sont activés par la liaison d’un ligand stéroide (glucocorticoides, hormone thyroide, acide rétinoique),
comportent un autre type de structure en “ doigt ”, basée sur une séquence similaire à celle reconnue par l’ion zinc : Cys-X2-Cys-X13-Cys-X2Cys (Figure 3). Ces doigts, appelés les doigts Cys2/Cys2 sont souvent non-répétés, contrairement aux motifs Cys2/His2. Ils reconnaissent des
séquences d’ADN petites et palindromiques.
Figure 3: Le domaine de liaison à l’ADN d’un récepteur nucléaire.
III.3 La famille des facteurs à glissière à leucine
La glissière à leucine est constituée d’un domaine riche en acide aminé leucine. Les protéines avec glissière à leucine se fixent à l’ADN sous
forme de dimères. Elles possèdent deux régions importantes. Une région à base du dimère, constituée par deux hélices alpha face à face
riches en leucine et interagissant par des liaisons de type hydrophobe. Une autre région riche en charges positives se fixe sur les groupes
phosphates de l’ADN. La région adjacente à la répétition riche en leucine est fortement basique dans chacune des protéines à glissière à
leucine, et comprend un domaine de liaison à l’ADN (Figure 4).
http://www.infobiogen.fr/services/chromcancer/IntroItems/TFactorsFr.html
20/02/2006
Les facteurs de transcription
Page 4 sur 4
Figure 4: Un motif de glisisière à leucine.
Les deux glissières à leucine forment une structure en Y, dans laquelle les glissières constituent la tige du Y et les deux régions basiques les
deux branches du Y qui lient l’ADN. Ceci est au moins connu pour le domaine structural appelé bZIP. Ceci explique pourquoi les séquences
reconnues par ces protéines sont des séquences répétées inversées sans région de séparation. Les glissières peuvent êtres utilisés pour
former aussi bien des homo- ou des hétéro- dimères. Ainsi, le facteur C/EBP (qui lie sous forme de dimère la boîte CAAT) comporte 4
répétitions, et les facteurs et , qui hétérodimèrisent pour former le facteur AP-1, comportent 5 répétitions.
III.4 La famille Hélice-Boucle-Hélice
Le motif Hélice-Boucle-Hélice ou Helix-Loop-Helix en anglais (HLH) a été identifié sur quelques protéines régulatrices du développement et des
gènes eucaryotes qui codent pour des protéines qui lient l’ADN. Les protéines contenant ce domaine ont la capacité de lier l’ADN et de
dimériser. Elles ont en commun un motif de 40-50 acides aminés comportant deux hélices alpha séparées par une région de longueur
différente en forme de boucle. Ces protéines forment des dimères via l’interaction entre les résidus hydrophobes sur les 2 hélices alpha. La
plupart des protéines à domaine HLH contiennent un domaine basique adjacent au domaine HLH, ce domaine basique (b) est nécessaire pour
la liaison à l’ADN. Les protéines contenant ce domaine sont appelées les bHLH, comme les facteurs ubiquitaires E12/E47 ou bien les facteurs
spécifiques de tissu comme les bHLH myogéniques.
Contributors : Valentina GUASCONI, Hakima YAHI, Slimane AIT-SI-ALI
http://www.infobiogen.fr/services/chromcancer/IntroItems/TFactorsFr.html
20/02/2006
Téléchargement