Biochimie - Acides nucléiques : structure et réplication, transcription et traduction BIOCHIMIE Cours 1 et 2 – Acides nucléiques : structure et réplication, transcription et traduction Pr Denamur I. Un acide nucléique consiste en 4 types de bases liées par un squelette sucre-phosphate A. L’ARN et l’ADN diffèrent par le sucre et une des bases B. Les nucléotides sont les unités monomériques des acides nucléiques II. Une paire de chaînes d’acide nucléique avec des séquences complémentaires peut former une double hélice avec une séquence complémentaire A. La double hélice est stabilisée par des liaisons hydrogène B. La double hélice facilite la transmission de l’information héréditaire C. La double hélice peut être dénaturée de façon réversible D. Les acides nucléiques simple-brin peuvent adopter des structures élaborées III. L’ADN est répliqué par des polymérases qui prennent leur instruction sur des matrices A. Les ADN polymérases nécessitent une matrice et une amorce B. La réplication de l’ADN se fait rapidement à partir de sites spécifiques IV. L’expression génique est la transformation de l’information de l’ADN en molécules fonctionnelles A. Plusieurs types d’ARN jouent un rôle clé dans l’expression B. Tous les ARN sont synthétisés par des ARN polymérases C. Les ARN polymérases prennent leurs instructions à partir des matrices d’ADN D. La transcription débute près des sites promoteurs et se termine à des sites terminateurs E. L’ARNt est une molécule adaptatrice dans la synthèse des protéines V. Les acides aminés sont codés par des groupes de 3 bases à partir d’un point fixe A. Les principales caractéristiques du code génétique B. L’ARNm contient des signaux de début et de fin pour la synthèse des protéines VI. La plupart des gènes eucaryotes sont des mosaïques d’introns et d’exons A. L’épissage de l’ARNm génère l’ARN mature B. De nombreux exons codent pour des domaines protéiques Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 1 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction I. UN ACIDE NUCLÉIQUE CONSISTE EN 4 TYPES DE BASES LIÉES PAR UN SQUELETTE SUCRE-PHOSPHATE Les acides nucléiques sont les porteurs de l’information génétique. On en distingue 2 types : • ADN : acide désoxyribonucléique • ARN : acide ribonucléique Ce sont des polymères linéaires faits d’unités similaires (différent de « identique ») connectées entre elles. Chaque unité monomérique est composée de 3 constituants : sucre, phosphate, base. La séquence des bases caractérise un acide nucléique et représente une forme d’information linéaire. A. L'ARN et l'ADN diffèrent par le sucre et une des bases Le sucre dans l’ADN est le désoxyribose. Le préfixe « désoxy » indique que le C en 2’ n’a pas d’atome d’oxygène à l’inverse du ribose, le sucre de l’ARN. On met des ‘ sur les C pour les distinguer de ceux des bases. Les sucres dans les acides nucléiques sont liés entre eux par des liaisons phosphodiester. Une liaison ester se fait entre un acide (phosphorique ici = phosphate) et un alcool (OH), ici on a 2 liaisons ester, d'où le « diester ». Le groupe 3’OH d’un sucre d’un nucléotide est estérifié par un groupe phosphate qui est joint au groupe OH en 5’ du sucre adjacent. Chaque liaison phosphodiester porte une charge négative qui repousse les espèces nucléophiliques, comme les ions hydroxydes, susceptibles d'hydrolyser la liaison. Ceci permet la protection de l'intégrité de l'information génétique. Cette liaison est aussi appelée liaison ester phosphorique. La chaîne des sucres liés par les liaisons phosphodiester représente le squelette de l’acide nucléique. Sur ce squelette sont fixées les bases : puriques, dérivant d’un noyau purine (Adénine, Guanine) et pyrimidiques, dérivant d’un noyau pyrimidine (Uracile, Thymine, Cytosine). Les bases sont des hétérocycles aromatiques (ou azotés). 3 à 8% des cytosines sont méthylées sur le C5 chez les eucaryotes, ce qui donne de la 5-méthylcytosine (il a dit qu'il en reparlera plus tard dans le cours). L'uracile est une base de l'ARN et la thymine, une base de l'ADN, seule la cytosine est commune à l'ADN et l'ARN parmi les bases pyrimidiques. Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 2 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction Formule des bases avec la numérotation des atomes : Les bases puriques sont structurellement plus complexes que les bases pyrimidiques. Les atomes sont numérotés sans ‘ par convention. L’absence du groupement OH en 2’ de l’ADN augmente sa résistance à l’hydrolyse. Cette plus grande stabilité de l’ADN explique probablement son utilisation plutôt que l’ARN comme matériel héréditaire dans toutes les cellules modernes et beaucoup de virus. L'ARN a un groupement hydroxyle en 2' qui va permettre la liaison phosphodiester 2'-5', importante pour l'excision des introns. B. Les nucléotides sont les unités monomériques des acides nucléiques L'unité formée d'une base liée à un sucre est appelée nucléoside. Les 4 nucléosides de l’ARN sont adénosine, guanosine, cytidine, uridine. Ceux de l’ADN sont désoxyadénosine, désoxyguanosine, désoxycytidine, thymidine (on ne parle pas de «désoxythymidine» car la thymine est forcément associée à un désoxyribose). Dans tous les cas, c’est le N9 de la purine et le N1 de la pyrimidine qui sont liés au C-1’ du sucre. *monomère = un seul Exemple : Les nucléotides: Un nucléotide est un nucléoside lié à un ou plusieurs groupes phosphate par une liaison ester : on a alors un nucléoside-5’phosphate. Exemple: ATP= adénosine 5’ tri-phosphate (transporteur d’énergie) Le professeur a aussi dessiné la structure du Désoxyguanosine 5' mono-phosphate (dGMP) Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 3 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction Les 4 unités nucléotidiques de l’ADN sont : • dAMP : désoxyadénosine-5'-monophosphate • dGMP : désoxyguanosine-5'-monophosphate • dCMP : désoxycytosine 5' monophosphate • TMP :thymidine 5' monophosphate Celles de l’ARN sont : • AMP : adénosine-5'-monophosphate • GMP • CMP • UMP pApCpG ou pACG = trinucléotide d’ADN composé de dAMP, dCMP et dGMP liés par des liaisons phosphodiesters. L’extrémité 5’ aura un phosphate attaché au groupe 5’-OH. Comme pour un polypeptide, la chaîne d’ADN a une polarité : une extrémité de la chaîne a un groupe 5’-OH attaché à un phosphate, alors que l’autre extrémité a un groupe 3’-OH qui peut être lié à un autre nucléotide. Par convention, la séquence des bases est notée 5’ vers 3’. ACG veut donc dire que 5’-OH non-lié est celui du dAMP, celui du 3’-OH non-lié sur le dGMP. À cause de cette polarité, ACG et GCA sont des composés différents. Une caractéristique étonnante des molécules d’ADN naturelles est leur taille. • Virus : 5000 paires de bases. • Escherichia coli : 4-6 106 paires de bases (ADN circulaire) • Homme : 3 109 paires de bases divisées en 24 molécules (chromosomes) distinctes (22 autosomes, X et Y) de tailles différentes (ADN «linéaire») • Daim : une molécule d'ADN comporte plus un milliard de paires de base. II. UNE PAIRE DE CHAÎNES D’ACIDES NUCLÉIQUES PEUT FORMER UNE DOUBLE HÉLICE AVEC UNE SÉQUENCE COMPLÉMENTAIRE La structure covalente des acides nucléiques rend compte de leur capacité à porter une information sous la forme d’une séquence de bases le long de la chaîne d’acide nucléique. La possibilité de former des paires de bases spécifiques de telle façon qu’une structure secondaire en hélice se forme facilite la réplication (génération de 2 copies à partir d’une) du matériel génétique. Importance de transmettre l'information génétique aux générations suivantes sans trop la modifier. Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 4 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction A. La double hélice est stabilisée par des liaisons hydrogènes Franklin et Wilkins, dans les années 50, obtiennent une photo de la diffraction aux rayons X de l’ADN, ce qui entraîne la découverte par Watson et Crick de la structure en double hélice en 1953. Deux chaînes polynucléotidiques sont enroulées en hélice autour d’un axe commun. Ces chaînes sont en direction opposée. Les squelettes sucre-phosphate sont en dehors, et les bases à l’intérieur. Les bases sont perpendiculaires à l’axe de l’hélice et les bases adjacentes sont séparées par 3,4 angströms (1 angström = 0.1 nm). La structure hélicoïdale se répète tous les 34 angströms, soit toutes les 10 bases = 1 tour d’hélice. Il y a donc une rotation de 36° par base (au total 360° pour les 10 bases = un tour complet). Le diamètre de l’hélice est de 20 angströms. Comment une structure aussi régulière peut elle s’accommoder d’une séquence arbitraire de bases, étant donné les tailles différentes des purines et des pyrimidines ? Entre G et C, on a 3 liaisons hydrogènes, contre 2 seulement entre A et T. Cet appariement était supposé par des études antérieures sur la composition en bases d’ADN de différentes espèces. Chargaff (1950) démontre que les ratios A/T et G/C sont proches de 1 dans toutes les espèces, alors que le ratio A/G varie considérablement (1,56 pour l'Homme, 1,67 pour la levure (eucaryote unicellulaire) et 0,7 pour la bactérie). Ces exemples de ratios A/G ont été écrits par le professeur. Retenir le principe On appelle cette règle la règle de Chargaff. Attention, ce sont les bases qui sont appariées spécifiquement et non pas les sucres ! ATTENTION, le sucre que porte la guanine et l'adénine sur ce schéma n'est pas du ribose mais du désoxyribose Polymère de nucléotide dans un sens apparié avec un autre polymère dans l'autre sens complémentaire. B. La double hélice facilite la transmission de l'information génétique Le modèle de la double hélice et l'observation d'un appariement spécifique des bases a immédiatement suggéré la façon dont le matériel génétique se réplique => réplication semiconservative. Les expériences de Menselson et Stahl (1958) confirment cette réplication semi-conservative chez E. coli par marquage de l’ADN parental avec un isotope lourd de l’azote, 15N, pour le rendre plus dense que l’isotope naturel 14N. Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 5 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction Quand l’incorporation du 15N est complète, la bactérie est mise dans un milieu avec du 14N. On regarde l’évolution du 15N et 14N par centrifugation au cours des générations. Réplication semi-conservative : les 2 brins mères se séparent et chacun subit séparément une réplication (en utilisant le 14N du milieu ici). On obtient ainsi 2 nouvelles paires de brins d’acides nucléiques filles à partir d’une seule paire mère. • Génération 0 : les acides nucléiques sont constitués uniquement de 15N => lourd (cf centrifugation) • Génération 1 : le milieu contient du 14N => la réplication donne des acides nucléiques filles hybrides, plus légers • Génération 2 : de la même manière, on obtient des acides nucléiques filles hybrides et des acides nucléiques filles uniquement composés de 14N = encore plus légers (cf centrifugation) Les résultats obtenus par centrifugation confirment l’hypothèse de la réplication semi-conservative. C. La double hélice peut être dénaturée de façon réversible Durant la réplication de l’ADN, les 2 brins de la double hélice doivent être séparés l’un de l’autre, au moins localement (hélicases + énergie ATP). Au laboratoire, ceci peut être obtenu en chauffant une solution d’ADN. Le chauffage détruit les liaisons hydrogène liant les bases. Les bases dans la double hélice absorbent moins la lumière UV que ne le font les bases quand l’ADN est simple brin = hyperchromisme. L'absorbance maximale de la lumière UV est à 270 dans les 2 cas. La température de dénaturation (Tm, pour « melting temperature ») est la température à laquelle la moitié de la structure hélicoïdale est perdue. La forme de la courbe (sigmoïde) montre que la dénaturation est un phénomène coopératif (fermeture éclair). Il existe une relation entre la Tm et la composition en bases. La Tm est proportionnelle au pourcentage de G/C. Les brins séparés complémentaires de l’ADN vont spontanément se réassocier de façon spécifique pour former une double hélice quand la température va descendre sous le Tm. C'est le principe de l’hybridation en biologie moléculaire. D. Les acides nucléiques simple-brin peuvent adopter des structures élaborées Les acides nucléiques simple brin (ARN par exemple) se replient sur euxmêmes pour former des structures définies. La plus simple est la « tigeboucle » (les bases rouges qui se font face (appariées) sont liées par des liaisons hydrogènes (= faibles)). Structures plus complexes : ARNr dans les ribosomes. Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 6 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction III. L’ADN EST RÉPLIQUÉ PAR DES POLYMÉRASES QUI PRENNENT LEURS INSTRUCTIONS SUR DES MATRICES A. Les ADN polymérases nécessitent une matrice et une amorce Les ADN polymérases catalysent la formation de chaînes polynucléotidiques par l’addition successive de nucléotides dérivant de désoxyribonucléosides triphosphate (dNTP). La réaction de polymérisation prend place seulement en présence d’une matrice d’ADN. Chaque nucléoside triphosphate forme d’abord une paire de bases avec une base de la matrice. Seulement ensuite l’ADN polymérase lie la nouvelle base avec la base précédente dans la chaîne. Les ADN polymérases sont donc des enzymes dépendantes de la matrice. Les ADN polymérases ajoutent des nucléotides à l’extrémité 3’ de la chaîne polynucléotidique.. Les ADN polymérases ont donc besoin de matrice d'ADN et d'amorce d'ARN pour initier la réplication, Cette réaction se fait dans le sens 5’->3’. (ADN)n + dNTP -> (ADN)n+1 + PPi Pour initier cette réaction, l’ADN polymérase a besoin d’une amorce appariée avec un 3’-OH libre. Les ARN polymérases peuvent elles commencer la synthèse d’ARN sans amorce. L'ADN polymérase catalyse l'attaque nucléophile du 3'-OH sur le phosphate alpha (le premier phosphate attaché au sucre). 1. Toutes les ADN polymérases ont des caractéristiques structurales en commun au niveau de l'unité polymérasique Fragment de Klenow de l’ADN polymérase I de E. coli. 2 parties principales : Unité polymérase 5’-3’ • Unité exonucléase 3’-5’ correctrice Le pouce et les doigts s’enroulent autour de l’ADN. Le site actif de l'enzyme est composé de résidus du domaine de la paume. Nécessite la présence de Mg2+. • 2. La spécificité de la réplication est dictée par la formation de liaisons hy drogène et la complémentarité entre les bases La fixation du « bon dNTP » est favorisée par la formation de la bonne paire de bases, avec le bon nombre de liaisons hydrogène (3 pour C-G, 2 pour A-T). 3. De nombreuses polymérases vérifient que la base ajoutée est la bonne et excisent les bases erronées Augmentation de la fidélité de réplication par un mécanisme de « proofreading » (activité relectrice et correctrice) = domaine exonucléasique 3'-5' (situé à 35 angströms en dessous du site actif de polymérisation. Il enlève le nucléotide mal apparié par hydrolyse. Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 7 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction Comment l’enzyme peut-elle « sentir » que la base ajoutée n’est pas correcte ? Ce n'est pas la bonne base, on a donc un mésappariement, sans liaison hydrogène stabilisatrice. On a alors une fluctuation du brin néosynthétisé qui se retrouve au niveau du site exonucléasique qui entraine l'hydrolyse. Cela crée une pause dans la synthèse. Cette activité augmente la spécificité de la réplication par un facteur 1000. B. La réplication de l’ADN se fait rapidement à partir de sites spécifiques Chez E. coli, la réplication de l’ADN commence en un site unique, l’origine de réplication, locus oriC, 245 paires de bases en quatre répétitions d’une séquence spécifique qui permettent la fixation de la protéine DnaA « concept fondamental » (reconnaissance spécifique entre une protéine et de l'ADN). Puis fixation de DnaB (reconnaissance spécifique entre deux protéines), qui est une hélicase qui utilise de l’ATP. L’hélicase permet l’ouverture de la double hélice d’ADN en une région riche en AT (moins de liaisons hydrogène donc plus facile à ouvrir). Formation d’une région ADN simple brin (ouverture grâce à DnaB), fixation de SSB (« single strand binding protein ») qui maintient les brins séparés. 1. Une amorce d’ARN synthétisée par une primase permet à la synthèse d’ADN de débuter L’ADN simple brin est accessible, mais la synthèse d’ADN ne peut pas commencer car il faut une amorce avec une extrémité 3’- OH libre. En fait, une ARN polymérase spécialisée, la primase, synthétise un court brin d’ARN (5 nucléotides) complémentaire de la matrice d’ADN. Les ARN polymérase ont un taux d’erreurs très élevé (pas d'activité correctrice), mais peuvent démarrer des chaînes de novo. L’ADN polymérase peut alors intervenir et commencer la synthèse d’ARN. L’amorce d’ARN est hydrolysée par une exonucléase 5’->3’, activité portée par le domaine additionnel de l’ADN pol I. 2. Un brin d’ADN est synthétisé de manière continue alors que l’autre est synthétisé par fragments (de manière discontinue) L’ADN est fait de 2 brins antiparallèles à répliquer. Or, l’ADN polymérase ne fonctionne que dans le sens 5’ → 3’. Okazaki a montré qu’une portion importante de l’ADN nouvellement synthétisé existe sous forme de courts fragments (1000 nucléotides) = fragments d’Okazaki. Fourche de réplication (endroit où s'ouvre l'ADN et où la répolication commence): La jonction des fragments d’Okazaki s’effectue grâce à une ligase qui catalyse la formation d’une liaison phosphodiester entre le 3’- OH à la fin d’une chaîne d’ADN et le 5’- P à l’extrémité de l’autre. 3. La réplication de l’ADN nécessite des polymérases hautement processives L’enzyme responsable de la réplication/synthèse de l’ADN chez E. coli est l’ADN pol III (multimérique), caractérisée par un pouvoir catalytique élevé (1000 nucléotides ajoutés par seconde), sa fidélité (activité proofreading) et sa processivité (capacité de l’enzyme à catalyser de nombreuses réactions consécutives sans relâcher son substrat). Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 8 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction 4. Les brins continu et discontinu sont synthétisés de façon coordonnée L’ADN pol III synthétise simultanément les brins continu et discontinu au niveau de la fourche de réplication. • Brin continu, primase (amorce d’ARN) puis synthèse d’ADN 5’->3’. • Brin discontinu, primase, synthèse des fragments d’Okazaki. La matrice du brin discontinu forme une boucle, le plaçant en position par une polymérisation 5’->3’. Les trous entre les fragments d’Okazaki sont comblés par l’ADN polymérase I qui utilise l’activité exonucléasique 5’-3’ pour enlever l’amorce d’ARN puis une ADN ligase relie les fragments entre eux. En plus de l’hélicase et SSB, la topoisomérase (ADN gyrase) introduit des supertours négatifs pour résoudre la crise topologique. Le brin torsadé et tiré aura tendance à former des nœuds, qui empêcheraient la réplication. Elle clive donc une chaine nucléotidique et le resynthétise après l'avoir «détordu». L'ADN gyrase est la cible de certains antibiotiques (quinolones) qui entrainent la mort de la bactérie en l'empêchant de répliquer leur ADN. La réplication chez les eucaryotes est mécaniquement similaire à la réplication chez les procaryotes, mais plus complexe. IV. L’EXPRESSION GÉNIQUE EST LA TRANSFORMATION DE L’INFORMATION DE L’ADN EN MOLÉCULES FONCTIONNELLES L’information stockée dans l’ADN va devenir utile quand elle va être exprimée par la production d’ARNs et de protéines. ADN = forme de stockage de l’information le plus possible à l’abri des modifications (mutations). ADN -> transcription -> ARN -> traduction -> protéine A. Plusieurs types d’ARN jouent un rôle clé dans l’expression • • • • ARNm : la matrice pour la synthèse des protéines (traduction) ARNt : transporte les acides aminés dans une forme inactivée au ribosome pour la formation de liaisons peptidiques, dans une séquence dictée par la matrice d’ARNm. Il y a au moins un type d’ARNt pour chacun des 20 acides aminés. ARNr : la majeure partie des ribosomes. Rôle catalytique et structural dans la synthèse des protéines. Petits ARNs non codants : rôle très important dans la régulation de l’expression génique. Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 9 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction Chez E. coli Quantité relative Nombre de nucléotides ARNr 80 % 3700/1700/120 23S 16S 5S ARNt 15 % 120 ARNm 5% Hétérogène (Taille moyenne d’un gène : 1,2kb) soit 1200 nucléotides pARNnc < 1% < 300 B. Tous les ARN sont synthétisés par des ARN polymérases La synthèse de l’ARN à partir d’une matrice d’ADN est appelée transcription et est catalysée par l’ARN polymérase qui nécessite les composés suivants : • Une matrice : la matrice préférée est l’ADN double brin (ce qui n'exclut pas les simples brins) Des précurseurs activés : les 4 ribonucléosides triphosphate (ATP, GTP, UTP, CTP) • Un ion divalent : Mg2+ ou Mn2+ • L’ARN polymérase catalyse l’initiation et l’élongation des chaînes d’ARN : (ARN)n + NTP -> (ARN)n+1 + PPi La synthèse de l’ARN ressemble à celle de l’ADN dans plusieurs aspects : Direction de la synthèse 5’->3’ • Le mécanisme de l’élongation est similaire (mais pas identique), le 3’- OH à l’extrémité de la chaîne naissante fait une attaque nucléophile sur le P le plus interne du nouveau nucléoside triphosphate et donc libère deux phosphates. Mais a des aspects différents : • Ne nécessite pas d’amorce pour débuter • N’a pas de capacité nucléasique pour exciser les nucléotides mal appariés. • Beaucoup plus lente (de 20 à 50 nucléotides/s) Chez E. coli, tous les types d’ARNs sont synthétisés par la même ARN polymérase. Chez les eucaryotes, il y a une division du travail selon les types d’ARNs entre différents types d’ARN polymérases. • C. Les ARN polymérases prennent leurs instructions à partir des matrices d’ADN La séquence de bases de l’ARN est le complément de celle du brin matrice de l’ADN. Le brin codant ADN a la même séquence que l’ARNm à l’exception de T à la place de U. ARNm 5'-CGCAGUUAAUCCC-3' Matrice d'ADN 3'-GCGTCAATTAGGG-5' Brin codant 5'-CGCAGTTAATCCC-3' D. La transcription débute près des sites promoteurs et se termine à des sites terminateurs Qu’est ce qui marque le début de l’unité transcriptionnelle ? Chez les bactéries, 2 « boîtes » à -10 (TATAAT) et -35 (TTGACA) nucléotides du site d’initiation de transcription. Ces séquences sont retrouvées dans la majorité des promoteurs procaryotes.(=consensus) Chaque promoteur diffère de ce consensus par 1 ou 2 bases. Chez les eucaryotes, on a la boîte TATA (TATAA) à -25 et la boîte CAAT (GGNCAATCT) à -75 du site d’initiation de transcription. La transcription est stimulée (ou inhibée) par des séquences d'ADN à distance Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 10 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction (peut être plusieurs kilobases) en 5’ ou 3’ en dehors du gène ou dans le gène (introns) : « Enhancers » (« Silencers »). L’ARN est synthétisé le long de la matrice d’ADN, puis fin, avec une séquence terminatrice : le signal de fin. Chez E. coli, structure en épingle à cheveu (tige-boucle) riche en GC (très stable, grâce aux triples liaisons). La chaîne d’ARN synthétisé se détache de l’ARN polymérase quand cette structure (tige boucle) est formée. Les signaux de début et de fin de transcription sont codés par la matrice d’ADN. E. L’ARNt est une molécule adaptatrice dans la synthèse des protéines Un ARNt contient un site d’attachement à l’acide aminé et un site de reconnaissance de la matrice. Concernant le site d’attachement, le groupement carboxyl de l’acide aminé est estérifié au groupement 3’- OH du ribose à l’extrémité 3’ de la chaine d’ARNt ARNt + acide aminé -> aminoacyl-ARNt (réaction catalysée par aminoacyl-ARNt synthétase) avec clivage d’ATP. Le site de reconnaissance est une séquence de 3 bases appelée anticodon qui reconnaît la séquence complémentaire de 3 bases sur l’ARNm appelé codon (cf à côté) V. LES ACIDES AMINÉS SONT CODÉS PAR DES GROUPES DE 3 BASES À PARTIR D’UN POINT FIXE Le code génétique est la relation entre la séquence de bases dans l’ADN (ou son transcrit en ARN) et la séquence des acides aminés dans les protéines. 3 nucléotides codent pour un acide aminé. Le code est non- chevauchant et dégénéré mais pas ambiguë. Quelques acides aminés sont codés par plus d’un codon. 64 triplets des 4 bases possibles. 20 acides aminés. 61 triplets -> acides aminés, 3 triplets (UAA, UAG, UGA) terminaison de traduction, codons « stop ». A. Les principales caractéristiques du code génétique Seuls le tryptophane et la méthionine sont codés par un seul triplet. Les autres 18 acides aminés sont codés par 2 ou plus triplets. Leucine, Arginine et Sérine sont codés par 6 codons chacun. Le nombre de codons pour un acide aminé est corrélé à sa fréquence d’occurrence dans les protéines. Les codons spécifiant le même acide aminé sont appelés synonymes. Cela n'est pas dû au hasard. Par exemple, GUU, GUC, GUA, GUG codent la Valine. La plupart des codons synonymes diffèrent seulement sur la troisième base du triplet. Quelle est la signification biologique de cette dégénérescence extensive du code génétique ? Si le code génétique n’était pas dégénéré, 20 codons désigneraient des acides aminés et 44 des « Stop ». Beaucoup de mutations -> stop : très délétère, inactivation de la protéine. La dégénérescence du code minimise l’effet délétère des mutations. La dégénérescence permet aussi à la composition en bases de l’ADN de varier considérablement sans changer la séquence des protéines codées par l’ADN. Le pourcentage de G/C de l’ADN des bactéries varie de 30 à plus de 70% car pour un même AA il y a plusieurs codons avec ou sans C/G. Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 11 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction B. L’ARNm contient des signaux de début et de fin pour la synthèse des protéines L’ARNm est traduit en protéines sur les ribosomes, gros complexe moléculaire fait de protéines et d’ARNs ribosomiques. Les codons Stop désignent la terminaison de la chaîne polypeptidique. Ils ne sont pas lus par un ARNt mais par des protéines spécifiques appelées « facteurs de terminaison ». La fixation de ces protéines sur les ribosomes libère la protéine nouvellement synthétisée. Le signal de début est plus complexe. Chez les bactéries, un ARNt spécifique, l’ARNt initiateur porte la formylméthionine, un acide aminé modifié. Cet ARNt reconnaît le codon AUG. Mais il existe des AUG autres dans l’ARNm qui correspondent à des méthionines internes. Donc AUG est seulement une partie du signal. Il existe aussi en amont une séquence riche en purines (séquence Shine Dalgarno) qui est complémentaire d’une séquence de l’ARN ribosomique : site de fixation du ribosome, - 10 en amont AUG. Le cadre de lecture est alors établi. VI. LA PLUPART DES GÈNES EUCARYOTES SONT DES MOSAÏQUES D’INTRONS ET D’EXONS Introns et exons ont donc la même taille. Chez les bactéries, les chaînes polypeptidiques sont codées de façon continue par les codons consécutifs. Chez les eucaryotes, on remarque la présence de séquences non-traduites = introns (« intervening sequences »), traduites = exons (« expressed sequences »). A. L’épissage de l’ARNm génère l’ARN mature L’ARN issu immédiatement après la transcription est le transcrit primaire. Ensuite, l’épissage de l’ARNm permet de former l’ARN mature (définitif). C’est un complexe formé de petits ARNs (régulateurs) et de protéines qui fait l’épissage. Les introns commencent par un GU et finissent par un AG précédé d’une séquence riche en pyrimidines. L'ARN va prendre une forme de lasso et il y a formation d'une liaison 2'-5' (importante pour l'excision des introns). Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 12 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction B. De nombreux exons codent pour des domaines protéiques De nombreux exons codent pour des unités structurales ou fonctionnelles des protéines. De nouvelles protéines sont créées au cours de l'évolution par réarrangement des exons : l’ADN est capable de recombinaisons. Mécanisme important : On peut également avoir un épissage alternatif (se passe dans un organisme) qui donne des protéines proches avec des « choix » de différents exons ( => avec un seul gène, de nombreuses combinaisons sont possibles en enlevant certains introns => protéines différentes possibles) Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 13 Biochimie - Acides nucléiques : structure et réplication, transcription et traduction Ce document est un support de cours datant de l’année 2014-2015 disponible sur www.tsp7.net 14