Le dogme central de la Biologie Moléculaire Unité de Biologie Moléculaire Acide DéoxyriboNucléique (ADN) Cours général (Transcription et Traduction) C. Jourlin-Castelli Transcription Acide RiboNucléique (ARN) Biologie Moléculaire Procaryote (Cours + TD) C.C. Zhang et C. Jourlin-Castelli Traduction Biologie Moléculaire Eucaryote (Cours + TD) Protéine D. Aragnol et C. Maurel-Zaffran L’ARN L’ARN : les bases ARN : Chaîne de nucléotides contenant du ribose ADN : Chaîne de nucléotides contenant du déoxyribose H Déoxyribose dNTP NTP nucléotide (Nucléoside TriPhosphate) déoxynucléotide Différence par rapport à l’ADN : l’uracile remplace la thymine Appariement : A-U et G-C L’ARN : orientation 5’ → 3’ Les différents types d’ARN ARN synthétisé et représenté dans le sens 5’ → 3’ Extrémité 5’ : phosphate Extrémité 3’ : hydroxyle Codants (traduits en protéines) : Les ARN messagers : ARNm Ne représentent que ~ 5% des ARNs de la cellule Non codants : - Les ARN ribosomiques : ARNr Classes les plus abondantes d’ARNs - Les ARN de transfert : ARNt La chaîne (ou brin) d’ARN = enchaînement de ribonucléotides GMP, AMP, CMP et UMP reliés par des liaisons phosphodiester entre le carbone 3’ d’un nucléotide et le carbone 5’ du suivant. 1 Les protéines L’ARN : structure → Chaînes d’acides aminés Structure primaire : séquence en nucléotide dans l’ARN Structure secondaire : R synthétisé sous forme simple brin H repliement sur lui-même (appariement des bases) H OH N C H Groupement amine Groupement carboxyle R : chaîne latérale → R diffère d’un acide aminé à l’autre → 20 acides aminés La structure des protéines Abréviation Acide aminé 3 lettres 1 lettre Alanine Arginine Asparagine Acide Aspartique Cystéine Acide Glutamique Glutamine Glycine Histidine Isoleucine Leucine Lysine Méthionine Phénylalanine Proline Serine Thréonine Tryptophane Tyrosine Valine Ala Arg Asn Asp Cys Glu Gln Gly His Ile Leu Lys Met Phe Pro Ser Thr Trp Tyr Val A R N D C E Q G H I L K M F P S T W Y V La liaison peptidique R1 R2 H H N C OH H O H C OH N C C O H H Acide aminé 1 Acide aminé 2 H 2O Extrémité amino-terminale (N-terminale) R1 H R2 N C Extrémité carboxy-terminale (C-terminale) H H OH N C C H O C O H Dipeptide Petite chaîne d’acides aminés : oligopeptide Longue chaîne d’acides aminés : polypeptide La structure des protéines La structure des protéines La structure primaire La structure secondaire → liaison hydrogène entre les acides aminés de la chaîne polypeptidique → 2 formes principales : hélice α et feuillet β → la séquence en acides aminés C-terminal Acide aminé O → Région double brin : structure tige-boucle (ou épingle à cheveux) U G C boucle C A A U C G G C tige G U C G U A 5’ A C U C A U A U C C G G C 3’ C N-terminal → L’hélice α 2 Structure secondaire des protéines La structure tertiaire Le feuillet β → repliement de la protéine sur elle-même La transcription La structure quaternaire → protéines formées de plusieurs chaînes polypeptidiques → multimères Homomultimères : un polypeptide en plusieurs exemplaires Hétéromultimères : différents polypeptides (également appelés sous-unités) La séquence informative de l'ADN, pour être convertie en une séquence protéique, doit être réécrite (transcrite) en une séquence d'ARN. Transcription = Processus de synthèse d’ARN à partir d’une matrice ADN Chaîne d’ARN synthétisée: identique à un brin de l’ADN (brin codant ou brin complémentaire) complémentaire de l’autre brin d’ADN (brin matrice) 5’ A T T A C G A C C T A C G C A T 3’ Brin codant (Brin complémentaire) ADN 3’ T A A T G C T G G A T G C G T A 5’ Brin matrice ARN La transcription 5’ A U U A C G A C C U A C G C A U 3’ Les ARN polymérases Ne concerne qu’une portion de l’ADN Synthétisent l’ARN dans le sens 5’ vers 3’ Démarre à un « promoteur » S’arrête à un « terminateur » (pas chez les eucaryotes) Ne nécessitent pas d’amorces ARN polymérase Se déplacent le long du brin matrice dans le sens 3’ vers 5’ 3 grandes étapes : initiation (début) initiation élongation terminaison élongation terminaison Structure en « pince de crabe » ADN promoteur terminateur 1 seule ARN polymérase chez les procaryotes Unité de transcription 3 ARN polymérases chez les eucaryotes : I, II et III Enzyme responsable : ARN polymérase 5’P 3’ OH ARN 3 Les ARN polymérases : complexité Les ARN polymérases : conservation 1 seul polypeptide 12 sous-unités ou plus Woychik and Reinberg (2001) Encyclopedia of Life Sciences L’ARN polymérase bactérienne Escherichia coli : vitesse de synthèse des ARNmessager = 50 nucléotides / seconde Woychik and Reinberg (2001) Encyclopedia of Life Sciences L’ARN polymérase bactérienne : les sous-unités ββ’ ββ β : 1342 résidus et β’ : 1407 résidus (Escherichia coli) Masse moléculaire ~ 500 kDa Contiennent le site catalytique de l’enzyme Complexe multi-protéique composé de plusieurs sous-unités : Interagissent directement avec l’ADN 1 sous-unité β 1 sous-unité β’ 2 sous-unités α Portent les sites de fixation des nucléosides triphosphates (NTP) Core enzyme : α2ββ’ω 1 sous-unité ω + sous-unité sigma Nécessaires au démarrage de la transcription et à la formation de la chaîne ARN Cibles de certains antibiotiques Holoenzyme : α2ββ’ωσ L’ARN polymérase bactérienne : la sous-unité α L’ARN polymérase bactérienne : la sous-unité ω 329 résidus (Escherichia coli) 91 résidus (Escherichia coli) Possède 2 domaines capables de se replier indépendamment et liés par un peptide d’environ 20 résidus domaine amino-terminal : αNTD (résidus 1 à 235) Apparemment pas de rôle direct dans la transcription Agirait comme protéine chaperonne dimérisation des sous-unités α assemblage avec les sous-unités β et β’ Faciliterait le repliement correct de la sous unité β’ domaine carboxy-terminal : αCTD (résidus 250 à 329) module de fixation à l’ADN (séquence « UP ») 4 Le cycle de transcription L’ARN polymérase bactérienne : la sous-unité σ Transcription = réaction très conservée entre procaryotes et eucaryotes Taille variable : 20 à 70 kDa Fixation de l’ARN polymérase sur les éléments du promoteur Formation d’un complexe stable : complexe fermé Sous-unité dissociable de l’ARN polymérase S’associe de manière réversible au « core » enzyme : holoenzyme (α2ββ’ωσ) Enroulement de l’ADN correspondant au promoteur autour de l’ARN polymérase Complexe intermédiaire Permet à l’ARN polymérase d’initier la transcription Plusieurs facteurs σ dans une même bactérie : 1 facteur σ principal responsable de la majorité de la transcription Séparation des brins d’ADN : formation de la « bulle » de transcription Complexe ouvert d’autres facteurs σ dits « alternatifs » ayant des fonctions spécialisées Initiation de la synthèse de l’ARN en présence de NTP Formation d’un hybride ARN-ADN Chez Escherichia coli, 7 facteurs σ différents : σ70 (RpoD) « principal » σ54 (RpoN) σ38 (RpoS) σ32 (RpoH) σ28 (FliA) σ24 (RpoE) σ19 (FecI) Terminaison et dissociation du complexe ADN-ARN-ARN polymérase « alternatifs » Initiation de la transcription : les éléments sur l’ADN Le cycle de transcription Complexe fermé Libération du promoteur et élongation (départ du facteur sigma chez les procaryotes) : progression de l’ARN polymérase le long de l’ADN Complexe intermédiaire Complexe ouvert +1 = nucléotide où commence la transcription site de démarrage de la transcription Promoteur : signal pour initier la transcription localisé en amont (avant) du site +1 n’est pas transcrit Drapkin and Reinberg (2002) Encyclopedia of Life Sciences Les séquences consensus du promoteur chez les procaryotes Efficacité des promoteurs Comparaison de plusieurs promoteurs 2 régions conservées : région -35 et région -10 Site de démarrage Aucun promoteur naturel contenant tous les éléments parfaits Promoteurs avec séquences proches des consensus = très efficaces → Promoteurs « forts » Promoteurs avec séquences éloignées des consensus = peu efficaces → Promoteurs « faibles » 35 pb en amont du +1 10 pb en amont du +1 5 Promoteurs procaryotes versus eucaryotes Procaryotes Promoteur bactérien de type σ70 Site d’initiation Région -35 Région -10 TTGACA TATAAT Site d’initiation Région -35 Consensus : TTGACA Région -10 N17 (N15-21) TATAAT N5-9 (A/G) Eucaryotes Site d’initiation Région -75 Région -25 GGNAATCT TATA (parfois présente) TATA box -35 +1 -10 5’ NNNTTGACANNNNNNNNNNNNNNNNNTATAATNNNNNNNANNNNNNNNNNN 3’ Brin codant (ou complémentaire) 3’ NNNAACTGTNNNNNNNNNNNNNNNNNATATTANNNNNNNTNNNNNNNNNNN 5’ Brin matrice ADN Promoteur → Région non transcrite 5’ ANNNNNNNNNNN 3’ ARN La sous-unité sigma 70 Le promoteur : les éléments « UP » Produit principalement pendant la phase exponentielle de croissance Présents dans certains promoteurs Reconnaît le plus grand nombre de promoteurs Localisés en amont de la séquence -35 Constituée de 4 domaines Riche en A/T Régions 2.4 et 4.2 reconnaissent respectivement les séquences -10 et -35 Reconnus par αCTD Région 2.3 impliquée dans l’ouverture du double brin Renforcent l’interaction entre l’ARN polymérase et l’ADN +1 « UP » -35 -10 Gruber and Gross (2003) Ann. Rev. Microbiol. vol 57: 441-466 Le facteur sigma 70 d’Escherichia coli Paget and Helmann (2003) Genome Biology, 4 :203 L’ARN polymérase et son interaction avec le promoteur Browning and Busby (2004) Nature Reviews Microbiology, vol 2 p 57-65. 6 Les premières étapes de la transcription Le complexe ouvert Complexe fermé Après la fixation de l’ARN polymérase : → Séparation (dénaturation) des deux brins d’ADN Complexe ouvert → Région dénaturée (environ de la position -12 à +3) inclut la région -10 → Formation d’une bulle de transcription Initiation de la synthèse de l’ARN Mécanisme : isomérisation → processus mal compris Départ du facteur sigma et élongation → le brin non-matrice est lié au domaine 2 du facteur σ de l’ARN polymérase (la région 2.3) Browning and Busby (2004) vol 2 p 57-65. Synthèse de transcrits « avortés » Libération du promoteur Dernière étape de l’initiation de la transcription Avant passage à l’étape d’élongation : → synthèse et relarguage par l’ARN polymérase d’un ensemble de transcrits « avortés » ARN polymérase se désengage du promoteur → longueur de ces transcrits : souvent entre 2 et 12 nucléotides, mais parfois jusqu’à 15 ou 17 nucléotides Relarguage du facteur sigma chez les procaryotes → pas de dissociation de l’ARN polymérase pendant cette initiation « avortée » Démarrage de la phase d’élongation : progression de l’ARN polymérase le long de l’ADN L’élongation Correction des erreurs Incorporation d’un mauvais nucléotide (cf mauvais appariement) → blocage de l’élongation (pause) 3’ Brin matrice → activation d’une activité nucléase de l’ARN polymérase 5’ Mouvement de l’ADN dans le complexe 5’ Deux protéines facilitant la reconnaissance de l’extremité 3’ du transcrit mal apparié au brin d’ADN matrice : GreA et GreB → fixation sur l’ARN polymérase et contact avec l’ARN naissant → activation de l’activité nucléase de l’ARN polymérase ARN naissant : → clivage de 2-3 nucléotides (pour GreA) jusqu’à 18 nucléotides (pour GreB) - Extrémité 3’ : appariement avec le brin matrice (environ 7-8 nucléotides) - Extrémité 5’ : passage dans un canal présent dans l’ARN polymérase (canal de sortie de l’ARN couvre environ 7 nucléotides) Richardson (2001) Encyclopedia of Life Sciences 7 Le facteur Mfd Le facteur NusA (Transcription Repair coupling factor) Facteur d’élongation conservé chez les procaryotes Présente des homologies structurales avec le facteur σ70 Permet de réactiver ou de recycler pendant l’élongation une ARN polymérase en pause Effet antagoniste en fonction du contexte (structure ARN, protéines associées) : Recrutement du système de réparation de l’ADN - Stimulation de l’élongation, rôle antiterminateur à certains sites (e.g. nut) notamment au niveau de terminateurs rho-dépendants - Stimulation de la pause de la RNAP à certains sites (e.g. opérons his et trp) et de la terminaison rho-indépendante La terminaison de la transcription (chez les procaryotes) La terminaison de la transcription dépendante d’un facteur intrinsèque (Rho-indépendante) Deux mécanismes : Séquences de terminateurs - Terminaison dépendante d’un facteur intrinsèque : Formation dans le transcrit d’une tige boucle riche en G et C, suivie d’une série de U (= terminateur) Formation d’une tige boucle Pause de l’ARN polymérase puis décrochage → arrêt de la transcription Déstabilisation du complexe ADN-ARN-ARNp - Terminaison dépendante d’un facteur extrinsèque : Fixation de la protéine Rho sur une séquence spécifique du transcrit Arrêt de la transcription Progression de Rho le long du transcrit Contact entre Rho et ARN polymérase → arrêt de la transcription E. Vieu, 2004 La terminaison de la transcription dépendante d’un facteur intrinsèque (Rho-indépendante) Formation de la structure tige boucle La terminaison de la transcription dépendante d’un facteur extrinsèque (Rho-dépendante) Protéine Rho : 6 sous unités identiques formant un anneau → structure émerge du canal de sortie → interaction faible entre extrémité 3’ de l’ARN et le brin ADN matrice Fixation de Rho sur un site appelé rut (rho utilization site) → site rut : région de 40 à 60 nucléotides sur le transcrit, riche en C, simple brin Progression de Rho le long du transcrit (nécessite hydrolyse ATP) Pas de point précis de terminaison : un site où l’ARN polymérase pause Richardson (2001) Encyclopedia of Life Sciences 8 La terminaison de la transcription dépendante d’un facteur extrinsèque (Rho-dépendante) La notion de gène Gène : région d’ADN portant l’information pour la synthèse d’un ARN ou d’une protéine gène 5’ 3’ 3’ 5’ promoteur ADN terminateur 5’P 3’ OH ARN ARN ribosomique ARN de transfert ARN messager Traduction Protéine E. Vieu, 2004 La notion d’opéron chez les procaryotes Le symbolisme chez les procaryotes Opéron : région d’ADN transcrite en un seul ARNm mais contenant l’information nécessaire à la synthèse de plusieurs protéines → trois lettres (se rapportant en général à la fonction du gène) opéron Gène : italique ou souligné Ex : hisA ou hisA Protéine : 1ère lettre en majuscule Ex : HisA 5’ 3’ 3’ 5’ promoteur ADN terminateur 5’P 3’ OH ARN messager polycistronique Traduction Protéine 1 Protéine 2 Protéine 3 9