Unité de Biologie Moléculaire L`ARN : les bases

publicité
Le dogme central de la Biologie Moléculaire
Unité de Biologie Moléculaire
Acide DéoxyriboNucléique (ADN)
Cours général (Transcription et Traduction)
C. Jourlin-Castelli
Transcription
Acide RiboNucléique (ARN)
Biologie Moléculaire Procaryote (Cours + TD)
C.C. Zhang et C. Jourlin-Castelli
Traduction
Biologie Moléculaire Eucaryote (Cours + TD)
Protéine
D. Aragnol et C. Maurel-Zaffran
L’ARN
L’ARN
: les bases
ARN : Chaîne de nucléotides contenant du ribose
ADN : Chaîne de nucléotides contenant du déoxyribose
H
Déoxyribose
dNTP
NTP
nucléotide
(Nucléoside TriPhosphate)
déoxynucléotide
Différence par rapport à l’ADN : l’uracile remplace la thymine
Appariement : A-U et G-C
L’ARN : orientation 5’ → 3’
Les différents types d’ARN
ARN synthétisé et représenté dans le sens 5’ → 3’
Extrémité 5’ : phosphate
Extrémité 3’ : hydroxyle
Codants (traduits en protéines) :
Les ARN messagers : ARNm
Ne représentent que ~ 5% des ARNs de la cellule
Non codants :
- Les ARN ribosomiques : ARNr
Classes les plus abondantes d’ARNs
- Les ARN de transfert : ARNt
La chaîne (ou brin) d’ARN = enchaînement de ribonucléotides GMP, AMP,
CMP et UMP reliés par des liaisons phosphodiester entre le carbone 3’ d’un
nucléotide et le carbone 5’ du suivant.
1
Les protéines
L’ARN : structure
→ Chaînes d’acides aminés
Structure primaire : séquence en nucléotide dans l’ARN
Structure secondaire :
R
synthétisé sous forme simple brin
H
repliement sur lui-même (appariement des bases)
H
OH
N
C
H
Groupement amine
Groupement carboxyle
R : chaîne latérale
→ R diffère d’un acide aminé à l’autre
→ 20 acides aminés
La structure des protéines
Abréviation
Acide aminé
3 lettres
1 lettre
Alanine
Arginine
Asparagine
Acide Aspartique
Cystéine
Acide Glutamique
Glutamine
Glycine
Histidine
Isoleucine
Leucine
Lysine
Méthionine
Phénylalanine
Proline
Serine
Thréonine
Tryptophane
Tyrosine
Valine
Ala
Arg
Asn
Asp
Cys
Glu
Gln
Gly
His
Ile
Leu
Lys
Met
Phe
Pro
Ser
Thr
Trp
Tyr
Val
A
R
N
D
C
E
Q
G
H
I
L
K
M
F
P
S
T
W
Y
V
La liaison peptidique
R1
R2
H
H
N
C
OH
H
O
H
C
OH
N
C
C
O
H
H
Acide aminé 1
Acide aminé 2
H 2O
Extrémité amino-terminale
(N-terminale)
R1
H
R2
N
C
Extrémité carboxy-terminale
(C-terminale)
H
H
OH
N
C
C
H
O
C
O
H
Dipeptide
Petite chaîne d’acides aminés : oligopeptide
Longue chaîne d’acides aminés : polypeptide
La structure des protéines
La structure des protéines
La structure primaire
La structure secondaire
→ liaison hydrogène entre les acides aminés de la chaîne polypeptidique
→ 2 formes principales : hélice α et feuillet β
→ la séquence en acides aminés
C-terminal
Acide aminé
O
→ Région double brin : structure tige-boucle (ou épingle à cheveux)
U
G
C
boucle
C
A
A U
C G
G C
tige
G U
C G
U A
5’ A C U C A U A U C C G G C 3’
C
N-terminal
→ L’hélice α
2
Structure secondaire des protéines
La structure tertiaire
Le feuillet β
→ repliement de la protéine sur elle-même
La transcription
La structure quaternaire
→ protéines formées de plusieurs chaînes polypeptidiques
→ multimères
Homomultimères : un polypeptide en plusieurs exemplaires
Hétéromultimères : différents polypeptides (également appelés sous-unités)
La séquence informative de l'ADN, pour être convertie en une séquence
protéique, doit être réécrite (transcrite) en une séquence d'ARN.
Transcription = Processus de synthèse d’ARN à partir d’une matrice ADN
Chaîne d’ARN synthétisée:
identique à un brin de l’ADN (brin codant ou brin complémentaire)
complémentaire de l’autre brin d’ADN (brin matrice)
5’ A T T A C G A C C T A C G C A T 3’
Brin codant
(Brin complémentaire)
ADN
3’ T A A T G C T G G A T G C G T A 5’ Brin matrice
ARN
La transcription
5’ A U U A C G A C C U A C G C A U 3’
Les ARN polymérases
Ne concerne qu’une portion de l’ADN
Synthétisent l’ARN dans le sens 5’ vers 3’
Démarre à un « promoteur »
S’arrête à un « terminateur » (pas chez les eucaryotes)
Ne nécessitent pas d’amorces
ARN polymérase
Se déplacent le long du brin matrice dans le sens 3’ vers 5’
3 grandes étapes :
initiation (début)
initiation
élongation
terminaison
élongation
terminaison
Structure en « pince de crabe »
ADN
promoteur
terminateur
1 seule ARN polymérase chez les procaryotes
Unité de transcription
3 ARN polymérases chez les eucaryotes : I, II et III
Enzyme responsable : ARN polymérase
5’P
3’ OH
ARN
3
Les ARN polymérases : complexité
Les ARN polymérases : conservation
1 seul polypeptide
12 sous-unités ou plus
Woychik and Reinberg (2001) Encyclopedia of Life Sciences
L’ARN polymérase bactérienne
Escherichia coli :
vitesse de synthèse des ARNmessager = 50 nucléotides / seconde
Woychik and Reinberg (2001) Encyclopedia of Life Sciences
L’ARN polymérase bactérienne : les sous-unités ββ’
ββ
β : 1342 résidus et β’ : 1407 résidus (Escherichia coli)
Masse moléculaire ~ 500 kDa
Contiennent le site catalytique de l’enzyme
Complexe multi-protéique composé de plusieurs sous-unités :
Interagissent directement avec l’ADN
1 sous-unité β
1 sous-unité β’
2 sous-unités α
Portent les sites de fixation des nucléosides triphosphates (NTP)
Core enzyme : α2ββ’ω
1 sous-unité ω
+ sous-unité sigma
Nécessaires au démarrage de la transcription et à la formation de la chaîne ARN
Cibles de certains antibiotiques
Holoenzyme : α2ββ’ωσ
L’ARN polymérase bactérienne : la sous-unité α
L’ARN polymérase bactérienne : la sous-unité ω
329 résidus (Escherichia coli)
91 résidus (Escherichia coli)
Possède 2 domaines capables de se replier indépendamment et liés par
un peptide d’environ 20 résidus
domaine amino-terminal : αNTD (résidus 1 à 235)
Apparemment pas de rôle direct dans la transcription
Agirait comme protéine chaperonne
dimérisation des sous-unités α
assemblage avec les sous-unités β et β’
Faciliterait le repliement correct de la sous unité β’
domaine carboxy-terminal : αCTD (résidus 250 à 329)
module de fixation à l’ADN (séquence « UP »)
4
Le cycle de transcription
L’ARN polymérase bactérienne : la sous-unité σ
Transcription = réaction très conservée entre procaryotes et eucaryotes
Taille variable : 20 à 70 kDa
Fixation de l’ARN polymérase sur les éléments du promoteur
Formation d’un complexe stable : complexe fermé
Sous-unité dissociable de l’ARN polymérase
S’associe de manière réversible au « core » enzyme : holoenzyme (α2ββ’ωσ)
Enroulement de l’ADN correspondant au promoteur autour de l’ARN polymérase
Complexe intermédiaire
Permet à l’ARN polymérase d’initier la transcription
Plusieurs facteurs σ dans une même bactérie :
1 facteur σ principal responsable de la majorité de la transcription
Séparation des brins d’ADN : formation de la « bulle » de transcription
Complexe ouvert
d’autres facteurs σ dits « alternatifs » ayant des fonctions spécialisées
Initiation de la synthèse de l’ARN en présence de NTP
Formation d’un hybride ARN-ADN
Chez Escherichia coli, 7 facteurs σ différents :
σ70 (RpoD)
« principal »
σ54 (RpoN)
σ38 (RpoS)
σ32 (RpoH)
σ28 (FliA)
σ24 (RpoE)
σ19 (FecI)
Terminaison et dissociation du complexe ADN-ARN-ARN polymérase
« alternatifs »
Initiation de la transcription : les éléments sur l’ADN
Le cycle de transcription
Complexe fermé
Libération du promoteur et élongation (départ du facteur sigma chez les
procaryotes) : progression de l’ARN polymérase le long de l’ADN
Complexe intermédiaire
Complexe ouvert
+1 = nucléotide où commence la transcription
site de démarrage de la transcription
Promoteur :
signal pour initier la transcription
localisé en amont (avant) du site +1
n’est pas transcrit
Drapkin and Reinberg (2002) Encyclopedia of Life Sciences
Les séquences consensus du promoteur chez les procaryotes
Efficacité des promoteurs
Comparaison de plusieurs promoteurs
2 régions conservées : région -35 et région -10
Site de démarrage
Aucun promoteur naturel contenant tous les éléments parfaits
Promoteurs avec séquences proches des consensus = très efficaces
→ Promoteurs « forts »
Promoteurs avec séquences éloignées des consensus = peu efficaces
→ Promoteurs « faibles »
35 pb en amont du +1
10 pb en amont du +1
5
Promoteurs procaryotes versus eucaryotes
Procaryotes
Promoteur bactérien de type σ70
Site d’initiation
Région -35
Région -10
TTGACA
TATAAT
Site d’initiation
Région -35
Consensus : TTGACA
Région -10
N17
(N15-21)
TATAAT
N5-9 (A/G)
Eucaryotes
Site d’initiation
Région -75
Région -25
GGNAATCT
TATA
(parfois présente)
TATA box
-35
+1
-10
5’ NNNTTGACANNNNNNNNNNNNNNNNNTATAATNNNNNNNANNNNNNNNNNN 3’
Brin codant
(ou complémentaire)
3’ NNNAACTGTNNNNNNNNNNNNNNNNNATATTANNNNNNNTNNNNNNNNNNN 5’
Brin matrice
ADN
Promoteur
→ Région non transcrite
5’ ANNNNNNNNNNN 3’
ARN
La sous-unité sigma 70
Le promoteur : les éléments « UP »
Produit principalement pendant la phase exponentielle de croissance
Présents dans certains promoteurs
Reconnaît le plus grand nombre de promoteurs
Localisés en amont de la séquence -35
Constituée de 4 domaines
Riche en A/T
Régions 2.4 et 4.2 reconnaissent respectivement les séquences -10 et -35
Reconnus par αCTD
Région 2.3 impliquée dans l’ouverture du double brin
Renforcent l’interaction entre l’ARN polymérase et l’ADN
+1
« UP »
-35
-10
Gruber and Gross (2003) Ann. Rev. Microbiol. vol 57: 441-466
Le facteur sigma 70 d’Escherichia coli
Paget and Helmann (2003) Genome Biology, 4 :203
L’ARN polymérase et son interaction avec le promoteur
Browning and Busby (2004) Nature Reviews Microbiology, vol 2 p 57-65.
6
Les premières étapes de la transcription
Le complexe ouvert
Complexe fermé
Après la fixation de l’ARN polymérase :
→ Séparation (dénaturation) des deux brins d’ADN
Complexe ouvert
→ Région dénaturée (environ de la position -12 à +3) inclut la région -10
→ Formation d’une bulle de transcription
Initiation de la synthèse de l’ARN
Mécanisme : isomérisation
→ processus mal compris
Départ du facteur sigma et élongation
→ le brin non-matrice est lié au domaine 2 du facteur σ de l’ARN polymérase
(la région 2.3)
Browning and Busby (2004) vol 2 p 57-65.
Synthèse de transcrits « avortés »
Libération du promoteur
Dernière étape de l’initiation de la transcription
Avant passage à l’étape d’élongation :
→ synthèse et relarguage par l’ARN polymérase d’un ensemble de
transcrits « avortés »
ARN polymérase se désengage du promoteur
→ longueur de ces transcrits : souvent entre 2 et 12 nucléotides, mais
parfois jusqu’à 15 ou 17 nucléotides
Relarguage du facteur sigma chez les procaryotes
→ pas de dissociation de l’ARN polymérase pendant cette initiation « avortée »
Démarrage de la phase d’élongation : progression de l’ARN polymérase le long
de l’ADN
L’élongation
Correction des erreurs
Incorporation d’un mauvais nucléotide (cf mauvais appariement)
→ blocage de l’élongation (pause)
3’ Brin matrice
→ activation d’une activité nucléase de l’ARN polymérase
5’
Mouvement de l’ADN
dans le complexe
5’
Deux protéines facilitant la reconnaissance de l’extremité 3’ du transcrit mal
apparié au brin d’ADN matrice : GreA et GreB
→ fixation sur l’ARN polymérase et contact avec l’ARN naissant
→ activation de l’activité nucléase de l’ARN polymérase
ARN naissant :
→ clivage de 2-3 nucléotides (pour GreA) jusqu’à 18 nucléotides (pour GreB)
- Extrémité 3’ : appariement avec le brin matrice (environ 7-8 nucléotides)
- Extrémité 5’ : passage dans un canal présent dans l’ARN polymérase
(canal de sortie de l’ARN couvre environ 7 nucléotides)
Richardson (2001) Encyclopedia of Life Sciences
7
Le facteur Mfd
Le facteur NusA
(Transcription Repair coupling factor)
Facteur d’élongation conservé chez les procaryotes
Présente des homologies structurales avec le facteur σ70
Permet de réactiver ou de recycler pendant
l’élongation une ARN polymérase en pause
Effet antagoniste en fonction du contexte (structure ARN, protéines associées) :
Recrutement du système de réparation de l’ADN
- Stimulation de l’élongation, rôle antiterminateur à certains sites
(e.g. nut) notamment au niveau de terminateurs rho-dépendants
- Stimulation de la pause de la RNAP à certains sites (e.g. opérons his
et trp) et de la terminaison rho-indépendante
La terminaison de la transcription
(chez les procaryotes)
La terminaison de la transcription dépendante
d’un facteur intrinsèque (Rho-indépendante)
Deux mécanismes :
Séquences de terminateurs
- Terminaison dépendante d’un facteur intrinsèque :
Formation dans le transcrit d’une tige boucle riche en G et C, suivie
d’une série de U (= terminateur)
Formation d’une tige boucle
Pause de l’ARN polymérase puis décrochage → arrêt de la transcription
Déstabilisation du complexe
ADN-ARN-ARNp
- Terminaison dépendante d’un facteur extrinsèque :
Fixation de la protéine Rho sur une séquence spécifique du transcrit
Arrêt de la transcription
Progression de Rho le long du transcrit
Contact entre Rho et ARN polymérase → arrêt de la transcription
E. Vieu, 2004
La terminaison de la transcription dépendante
d’un facteur intrinsèque (Rho-indépendante)
Formation de la structure tige boucle
La terminaison de la transcription dépendante
d’un facteur extrinsèque (Rho-dépendante)
Protéine Rho : 6 sous unités identiques formant un anneau
→ structure émerge du canal de sortie
→ interaction faible entre extrémité 3’ de l’ARN et le brin ADN matrice
Fixation de Rho sur un site appelé rut (rho utilization site)
→ site rut : région de 40 à 60 nucléotides sur le transcrit, riche en C,
simple brin
Progression de Rho le long du transcrit (nécessite hydrolyse ATP)
Pas de point précis de terminaison : un site où l’ARN polymérase pause
Richardson (2001) Encyclopedia of Life Sciences
8
La terminaison de la transcription dépendante
d’un facteur extrinsèque (Rho-dépendante)
La notion de gène
Gène : région d’ADN portant l’information pour la synthèse d’un ARN ou d’une protéine
gène
5’
3’
3’
5’
promoteur
ADN
terminateur
5’P
3’ OH
ARN
ARN ribosomique
ARN de transfert
ARN messager
Traduction
Protéine
E. Vieu, 2004
La notion d’opéron chez les procaryotes
Le symbolisme chez les procaryotes
Opéron : région d’ADN transcrite en un seul ARNm mais contenant l’information
nécessaire à la synthèse de plusieurs protéines
→ trois lettres (se rapportant en général à la fonction du gène)
opéron
Gène : italique ou souligné
Ex : hisA ou hisA
Protéine : 1ère lettre en majuscule
Ex : HisA
5’
3’
3’
5’
promoteur
ADN
terminateur
5’P
3’ OH
ARN messager
polycistronique
Traduction
Protéine 1
Protéine 2
Protéine 3
9
Téléchargement