COURS DE BIOLOGIE MOLÉCULAIRE 1 Présenté par: Pr A.HAMMOUMI Ecole supérieure de Technologie BIOLOGIE MOLÉCULAIRE C’est une discipline consacrée à l'étude: des molécules qui portent l’information génétique (=réplicons), leur structure, synthèse et altérations (mutations). L’information génétique est constituée des gènes codant pour des protéines, mais également de séquences d'ADN non codantes, intervenant dans la régulation de l'expression génique. L’unité de l’information génétique est le gène. La totalité de l’information génétique est le génome. 2 I- L’INFORMATION GÉNÉTIQUE Le stockage du matériel génétique se fait dans une structure physiquement et chimiquement stable. Cette structure doit être capable d’autoréplication et d’autoréparation = réplicon Les réplicons peuvent être : l’ADN ou l’ARN chromosomique ou l’ADN ou l’ARN extrachromosomique (plasmide, phage). Pour la majorité des êtres vivants, cette structure est la double hélice formée de deux brins antiparallèles (Watson et Crick, 1950). 3 Les molécules d’acides nucléiques sont porteuses de l’information génétique. Il en existe deux types: ADN = acide désoxyribonucléique ARN= acide ribonucléique ADN: chaque cellule présente une copie du matériel génétique sous forme d’une longue molécule d’ADN qui porte plusieurs milliers de gènes. Chaque gène est un segment linéaire de la molécule d’ADN. ARN: les molécules d'ARN sont beaucoup plus courtes, sont utilisées pour transmettre l'information génétique à la machinerie cellulaire, et transporter un seul ou quelques gènes. 4 Remarque: certains virus utilisent l'ARN pour coder leurs génomes. Ces virus à ARN ont des génomes courts comportant une dizaine de gènes. 5 DOGME CENTRAL ADN Transcription ARN Traduction Protéines Réplication LES 3 EXCEPTIONS AU DOGME CENTRAL (1) Transcription Inverse Cas du virus du SIDA, le HIV. Le génome du rétrovirus, constitué d'ARN, est transcrit en ADN après infection et va s'intégrer dans le génome de l'hôte, d'où il est à nouveau transcrit pour former de l'ARN et des protéines virales. ADN (1) ARN (2) Protéines (2) Réplication Cas des virus à ARN Les virus à ARN produisent leurs propres enzymes pour répliquer leurs génomes, dans des structures pratiquement indépendantes de la machinerie normale de l'hôte. (3) (3) Pseudo-réplication cas des prions Les prions sont des agents infectieux qui ne contiennent pas d'acides nucléiques: Ce sont des protéines porteuses d'information, mais que cette information n'est que structurelle: les prions peuvent induire chez des protéines normales un changement de conformation qui se propage graduellement et peut être transmis d'individu à individu. Les maladies à prions sont toutes des maladies dégénératives 6 du système nerveux central (maladie de la "vache folle"). 7 II- STRUCTURE CHIMIQUE DES ACIDES NUCLÉIQUES Les acides nucléiques sont des molécules linéaires constituées d’une chaîne de nucléotides. Il existe 4 nucléotides différents et chaque nucléotide est formé par: Un groupe phosphate Un sucre à 5 carbones (=pentose) Une base azotée 8 Les groupes phosphates se lient aux sucres pour former le squelette de la molécule d’ADN ou d’ARN. Les bases azotées se lient aux sucres sur les côtés latéraux. Le sucre est un: Pour l’ARN Base azotée + sucre = nucléoside Nucléoside + groupe phosphate = nucléotide Pour l’ADN 9 Les nucléotides sont liés par la liaison phosphodiester entre le groupe phosphate: et le carbone 5’ du sucre d’un nucléotide; et le carbone 3’ du sucre de le nucléotide suivant. Les groupes phosphates portent une charge négative. 10 Il existe 5 bases azotées différentes liées aux nucléotides: pour l’ADN, il contient: adénine (A), guanine (G), cytosine (C) et thymine (T). pour l’ARN, il contient: adénine (A), guanine (G), cytosine (C) et uracile (U). Les bases azotées peuvent se subdiviser en deux types: Les purines (A et G): présente deux cycles Les pyrimidines (T, C et U): présente seul cycle 11 ADN DOUBLE BRIN EN DOUBLE HÉLICE La molécule d’acides nucléiques est polaire. Elle présente un groupe phosphate libre à l’extrémité 5’ terminale de la chaîne et un groupe hydroxyle libre à l’extrémité 3’ terminale de la chaîne. La lecture de l’information génétique commence de l’extrémité 5’ terminale. L’ADN est généralement: double brin et antiparallèle (l’extrémité 5’ d’un brin est opposé à l’extrémité 3’ de l’autre brin) = DOUBLE HELICE (Watson et Crick, 1950). et, l’ARN est monobrin. 12 La double hélice est stabilisée par: les liaisons hydrogènes entre les bases azotées et par l’empilement des cycles aromatiques des bases azotées au centre de l’hélice. liaisons hydrogènes cycles aromatiques 13 Les paires de bases (pb) se lient entre elles par des liaisons hydrogènes: A s’apparie avec T avec 2 liaisons hydrogènes =STRUCTURE SECONDAIRE DE L’ADN Dénaturation: température, urée, formamide G s’apparie avec C avec 3 liaisons hydrogènes 14 Dans une molécule d’ADN, il y a autant de A que de T et autant de C que de G: A = T et C = G On peut aussi calculer le coefficient de Chargaff = (A + T) / (C+G) Exemple de Coefficient de Chargaff Organisme A T G C Rapport A+T/G+C E. Coli 26.0 23.9 24.9 25.2 1.0 D.pneumoniae 29.8 31.6 20.5 18.0 1.59 Levure 31.3 32.9 18.7 17.1 1.79 Rat 28.6 28.4 21.4 21.5 1.33 Homme 30.3 30.3 19.9 19.8 1.52 15 Rappel: l’information génétique chez les procaryotes et les eucaryotes 1 seul chromosome: d’environ 1 mm de long, circulaire, bicaténaire en double hélice. Il contient 3000 à 4000 gènes. Plus de 2 chromosomes: linéaire, bicaténaire en double hélice. Ils contiennent plus de 50000 gènes. 16 TAILLES DES GÉNOMES 17 Les gènes sont des segments d’un long filament d’ADN connu sous le nom de chromosome. 18 Chez les procaryotes: Les gènes peuvent être séparés par des régions intergéniques qui sont très courtes. Plusieurs gènes peuvent être regroupés sans être séparés par des régions intergéniques = un opéron. Il est sous le contrôle d’une région de régulation. Les opérons sont transcrits pour donner une seule molécule d’ARN comportant plusieurs gènes. 19 A l’intérieur de la cellule, l’ADN bactérien est super-enroulé (=super-enroulement) ou sous forme circulaire relâchée grâce à l’ADN gyrase et à la topoisomérase I : 20 Chez les eucaryotes: L’ADN est linéaire et bicaténaire. Les chromosomes sont de longs filaments d’ADN associés à des protéines pour maintenir sa structure: les histones. ADN + HISTONES = chromatine L’unité de base de la chromatine = nucléosome = ADN + 8 histones (H2A, H2B, H3 et H4) + 1 histone H1 21 La chromatine est ensuite condensée pour former le chromosome. 22 Les gènes eucaryotes sont séparés par des régions intergéniques et des régions non codantes appelées introns. Les régions codantes sont dites exons. Intron = fragment non codant d'un gène situé entre deux exons. 23 ELIMINATION DES INTRONS AVANT LA SYNTHÈSE DES PROTÉINES: 24 III- MULTIPLICATION CELLULAIRE: LA RÉPLICATION DE L’ADN Définition: la réplication est le processus au cours duquel 2 copies d’ADN sont synthétisées à partir de la molécule d’ADN parentale. Elle a lieu avant la division cellulaire et est semi-conservative (Melselson et Stahl, 1958): les doubles hélices résultantes sont constituées d’un brin nouvellement formé et d’un brin parental (= brin matriciel). Un brin parental est conservé dans chaque nouvelle molécule d'ADN. 25 La réplication de l’ADN se fait toujours dans le sens 5’ 3’. Les enzymes catalysant l’addition des nucléotides sont les ADN polymérases. 5’ 3’ 26 L’addition d’un nouveau nucléotide par l’ADN polymérase III nécessite une extrémité 3’OH libre préexistante. La synthèse d’une nouvelle chaine d’ADN nécessite donc la présence d’une amorce nucléotidique à laquelle la polymérase pourra fixer le premier nucléotide. Amorce = petit fragment d’ARN (< 15 nucléotides), complémentaire avec le brin d’ADN matriciel et terminé par un groupement 3’-OH libre. Cette amorce est synthétisée au début de la réplication par la primase. L’élongation de la molécule se fait sous forme d’ADN. L’amorce sera ensuite enlevée et remplacée par de l’ADN par l’ADN polymérase I. 27 Résumé des étapes de la réplication: (à apprendre par cœur) 1) Déroulement de la structure super-enroulée de l’ADN grâce aux topoisomérases. 2) La réplication débute au point d’origine ori. 3) 4) 5) 6) 7) L’hélicase s’attache à l’un des brins du chromosome et l’ouvrent en formant une boucle. Des protéines « ssb » vont se fixer à l’ADN simple brin pour empêcher les deux brins de s’apparier et reformer la double hélice. La primase synthétise les amorces pour fournir l’extrémité 3’-OH libre sur laquelle seront attachés les nucléotides. L’ADN polymérase III synthétise une première chaîne d’ADN (= brin avancé) dans le sens 5’ 3’. La synthèse de la deuxième chaîne (=brin retardé) se fait dans le sens opposé au sens de déplacement de la fourche de réplication. On distingue alors: un brin avancé qui est transcrit directement. brin retardé qui est synthétisé sous forme de fragments d’Okazaki. Ces fragments sont ensuite reliés entre eux grâce à l’ADN ligase. un 28 8) Les amorces sont enlevés et remplacés par l’ADN par la polymérase I. 9) L’ADN ligase collent les coupures dans l’ADN. 29 A - LA RÉPLICATION DE L’ADN BACTÉRIEN Quand la bactérie se divise, le chromosome s’ouvre au niveau de l’origine de réplication « ori ». C’est une séquence unique d'ADN permettant l'initiation de la réplication. La réplication est généralement bidirectionnelle : deux fourches de réplication progressent dans deux directions opposées (=structure thêta notée, Ɵ). structure Ɵ 30 31 B - LA RÉPLICATION DE L’ADN EUCARYOTES Un chromosome eucaryote possède plusieurs origines de réplication. Chaque origine de réplication est appelée œil de réplication. La réplication est aussi bidirectionnelle. 32 33 Correction des erreurs d’élongation: Des erreurs peuvent se produire au cours de la réplication et conduire à des mutations = changement dans la séquence d’ADN. Mais le taux de mutations sont très faibles: 10-8 à 10-11 erreurs par pb inséré. Ce faible taux est dû à 2 raisons: Règles d’appariement de bases A avec T et G avec C sur le brin matriciel. correctrice des polymérases I et III. Elles sont capables d’enlever le nucléotide mal apparié et de le remplacer par le bon. Activité 34 IV-TRANSCRIPTION DES GÈNES 35 Définition: la transcription produit une copie d’un gène sous forme d’ARN. Promoteur: permet l’initiation (début) de la transcription Terminateur: permet la terminaison (fin) de la transcription 36 On distingue deux grandes classes d’ARN: 1. ARN informationnels (= porteur de l’information génétique): Ce sont des ARN intermédiaires dans le décodage des gènes en protéines = ARN messager (ARNm) 2. ARN fonctionnels : Ces ARN sont le produit final et ne sont jamais traduits en protéines. Ils interviennent dans différentes étapes du traitement de l’information génétique de l’ADN en protéines: ARN de transferts (ARNt): permettent le transfert des acides aminés (aa) au cours de la synthèse des protéines. ARN ribosomaux (ARNr): forment les ribosomes et interviennent donc dans la synthèse des protéines. En plus du rôle fonctionnel, ils ont un rôle structure. 37 Comparaison transcription/ réplication Les ressemblances • Transcription se fait toujours dans le sens 5’ 3’. Le brin matrice est antiparallèle au brin nouvellement synthétisé. • Trois phase principales: Initiation, Elongation et Terminaison Les différences L’ARN est différent de l’ADN sur plusieurs point importants: 1. ARN est une séquence nucléotidique simple brin 2. Le sucre de l’ARN est un ribose et non un désoxyribose (ADN) 3. La synthèse des ARN utilise les mêmes bases sauf que l’Uracile remplace la thymine ( U forme des liaisons hydrogène avec l’adénine) Les enzymes intervenant dans la transcription ne sont pas les mêmes utilisés dans la réplication et ne nécessitent pas d’amorce pour initier la synthèse de l’ARN. 38 Enzyme clé de la transcription La transcription est une lecture d’un gène par une enzyme dite ARN polymérase qui synthétise un acide ribonucléique dont la structure primaire reproduit celle du brin « sens » de ce gène 39 • Il existe différentes ARN polymérases: Chez les procaryotes : une seule ARN polymérase transcription des ARNm + autres types d’ARN Chez les eucaryotes: plusieurs ARN polymérases ARN pol.I transcription des ARNr sauf l’ARNr 5S ARN pol.II transcription des ARNm ARN pol.III transcription des ARNt et de l’ARNr 5S 40 A. LA TRANSCRIPTION CHEZ LES PROCARYOTES: E. COLI INITIATION Elle commence avec la fixation spécifique de l’ARN polymérase au niveau du site d’initiation appelé promoteur grâce au facteur sigma ( ). Qu’est qu’un promoteur et qu’est ce que le facteur ? 41 Qu’est qu’un promoteur? • Les promoteurs sont des séquences d’ADN spécifiques auxquelles se fixent les ARN polymérases. Il a pour rôle d’orienter l’ARN polymérase dans une direction précise. • Il existe deux courtes séquences importantes dans le promoteur : -35 et -10 elles permettent la reconnaissance du promoteur par l’ARN polymérase (facteur sigma). • Les deux séquences diffèrent entre différentes espèces d’E. coli mais des séquences consensus ont été établi : 1) La région -35 = 5ʹ–TTGACA–3ʹ 2) La région -10 = 5ʹ–TATAAT–3ʹ 42 Etablissement d’une séquence consensus chez E.coli: 43 La force (ou efficacité) d’un promoteur est le nombre d’initiation par unité de temps (vitesse de la transcription). La force du promoteur dépend: de la proportion des paires de bases A-T par rapport aux paires de bases C-G. de la position des séquences en -35 et en -10. Plus les séquences consensus sont proches du site d’initiation plus le promoteur sera fort. de la force d’interaction de l’ARN-polymérase avec le promoteur. 44 Qu’est ce que le facteur ? • ARN polymérase est formée de 5 sous-unités α2ββʹϖ (= core enzyme) et d’une 6ème sous-unité appelée le facteur sigma ( ) l’ensemble est appelé holoenzyme. • Seule l’holoenzyme peut initier la transcription • l’holoenzyme parcourt l’ADN à la recherche des promoteurs et le facteur reconnait spécifiquement les deux région -35 et -10 • La phase de l’initiation se termine quand l’holoenzyme réussit la synthèse d’un ARN < à 9 nucléotides le facteur se détache laissant le core enzyme de l’ ARN pol poursuivre l’élongation. 45 SCHÉMA DE L’INITIATION DE LA TRANSCRIPTION 46 ÉLONGATION 1. ARN pol. glisse sur l’ADN et synthétise l’ARN complémentaire du brin matrice d’ADN 2. Au fur et à mesure, ARN pol. sépare les brins d’ADN ( voir bulle de transcription) 3. L’élongation se fait dans le sens 5’ 3’ par la formation des liaisons phosphodiesters 4. ARN pol. forme un hybride ARN-ADN transitoire dans la région déroulée 5. Derrière l’ARN pol. l’ADN se referme 6. ARN sort du complexe ARN pol. sous forme simple brin (en vert) Région hybride ARN-ADN Sens de l’élongation Brin matriciel Brin codant bulle de transcription SCHÉMA DE L’ÉLONGATION AU COURS DE LA TRANSCRIPTION 47 Remarque: l’élongation se réalise de la même manière chez les eucaryotes. TERMINAISON La terminaison se produit quand la région hybride ARN-ADN est forcée à se séparer. Il y a libération de l'ARN polymérase + du brin d’ARN (= le transcrit). Il existe deux mécanismes de terminaison. 48 LES MÉCANISMES DE LA TERMINAISON Deux mécanismes: Pour certains gènes, une protéine appelée facteur ρ (rho) est responsable de la terminaison Terminaison ρ dépendante Pour d'autres gènes, la terminaison ne nécessite pas la participation du facteur ρ Terminaison ρ indépendante. 49 Terminaison ρ-dépendante Le processus de terminaison nécessite deux sites: 1. Le facteur ρ se lie sur un site qu’il reconnait sur l’ARN puis se déplace dans la direction de l'ARN polymérase. 2. Sur le site de terminaison, l'ADN code pour une séquence d'ARN riche en GC. Une structure en épingle à cheveux est immédiatement formée. Elle se lie rapidement à l'ARN polymérase provoquant l’arrêt de la synthèse de l'ARN. Cet arrêt de la synthèse de l'ARN: permet au facteur ρ de rattraper la structure en épingle à cheveux et de casser les liaisons hydrogènes entre l'ADN et l'ARN dans le complexe ouvert. Le facteur ρ est une hélicase qui sépare les 2 brins hybrides ARN-ADN. le brin d'ARN est séparé de l'ADN avec l'ARN polymérase. 50 site de terminaison: Structure en épingle à cheveux 51 Terminaison ρ-indépendante Ne nécessite pas de facteur ρ Dans ce cas, le terminateur est composé de deux séquences nucléotidiques voisines qui interagissent avec l'ARN : 1. Une séquence riche en U située à l'extrémité 3ʹ de l'ARN 2. Une séquence qui favorise la formation d'une structure en épingle à cheveux. 52 53 NB: Chez E.coli, environ ½ des gènes montrent des terminateurs rho indépendants et l'autre ½ des terminateurs rho dépendants. 54 B. LA TRANSCRIPTION CHEZ LES EUCARYOTES Les eucaryotes possèdent plusieurs ARN polymérases ARN pol.I transcription des ARNr sauf l’ARNr 5S ARN pol.II transcription des ARNm ARN pol.III transcription des ARNt et de l’ARNr 5S Les ARN pol I, II et III ont une structure très semblable et sont formés de plusieurs sous unités. 55 TRANSCRIPTION CHEZ LES EUCARYOTES 56 PROMOTEUR ET ÉLÉMENTS DE RÉGULATION Le gène chez les eucarytes est formé: Promoteur formé par une séquence consensus TATAAA dite TATA box et du site d’initiation de la transcription. Éléments de régulation qui sont de courtes séquences d’ADN qui jouent un rôle dans la reconnaissance du promoteur par l’ARN pol. Il en existe deux types: o séquences d’activation qui stimulent la transcription o Séquences d’ inhibition qui inhibent la transcription Ces éléments sont reconnus par des Facteurs de Transcription (FT). 57 FACTEURS DE TRANSCRIPTION (FT) Les ARN pol I, II et III sont incapables de se fixer sur l’ADN en absence du FT (I, II ou III selon l’ ARN pol considéré). Initiation de la transcription se fait grâce à: ARN pol + FT les FTs fixent l’ARN pol sur le promoteur. La transcription commence par l’assemblage séquentiel des FTs 58 L’ASSEMBLAGE SÉQUENTIEL DU COMPLEXE D’INITIATION ARN polymérase II 1. Le promoteur (boîte TATA) est reconnu par le facteur TFIID. 2. L’adjonction successive de TFIIB et TFIIF, sont nécessaires pour la fixation de la ARN pol. 3. TFIIE et TFIIH s’ajoutent successivement initiation de la transcription. 4. TFIIH : activité hélicase dérouler l’ADN au voisinage du site d’initiation, et une activité protéine kinase qui, en phosphorylant l’ARN polymérase, lui permet de se libérer du complexe d’initiation et d’assurer l’élongation. 59 La terminaison de la transcription Les mécanismes sont moins bien connus que chez les procaryotes. Les mécanismes diffèrent d’une ARN pol à une autre. Pour les gènes transcrits par ARN pol II, l’arrêt de la transcription s’effectue toujours après un site de polyadénylation. Arrêt de la transcription ADN ARN 60 LA MATURATION DES ARN MESSAGERS Eucaryotes : ARNm = les ARN pré-messagers maturation fonction La maturation des ARN pré-messagers : se déroule dans le noyau et se fait en 3 étapes principales: 1)Mise en place de la coiffe (ou cap) à l’extrémité 5’, 1)Poly-adénylation en 3’, 2)et excision-épissage. 61 1) Mise en place de la coiffe à l’extrémité 5’ Elle se produit après le début de transcription. C’est l’ajout de 7-méthylguanosine du côté 5’ par une guanyltransférase (2) suivi de deux étapes de méthylation par des méthyltransférases (3 et 4). 62 La coiffe a plusieurs fonctions: a) Définit l’extrémité 5’ du premier intron, b) Permet un épissage dans de bonnes conditions, c) Participe au transport des ARNm dans le cytoplasme, d) Protège les ARNm des nucléases et e) Intervient dans l’initiation de la traduction 63 2) Poly-adénylation de l’extémité 3’ une endonucléase coupe la fin de l’ARN à environ une quinzaine de nucléotides après le signal : AAUAAA . Sur l’extrémité 3’OH de cette coupure, une polyA polymérase synthétise 200 à 2000 adénine L’ARN primaire se trouve allongé d’une « queue poly(A) ». endonucléase 64 Rôles de la polyadénylation: 1. La migration des ARNm dans le cytoplasme, 2. Protège les ARNm de la dégradation et 3. Contribue à l’initiation de la traduction 65 3) Excision-épissage • Les introns sont excisés (coupés) du pré-ARNm (= excision). • Les exons sont ensuite liés entre eux bout à bout (= épissage). Excision 66 67