MASTER 1 STAPS Dr Stéphan Clavel Biochimie - Physiologie [email protected] 04.92.07.68.93 LABORATOIRE DE BIOLOGIE CELLULAIRE & MOLECULAIRE UMR-CNRS 6548 «Signalisation et différentiation des cellules musculaires» 1. Introduction Générale Les protéines ont une durée de vie limitée (entre quelques min à quelques jours) elles doivent être renouvelées en permanence - « Entretien » - Croissance - Cicatrisation Rq: certaines protéines de la matrice extracellulaire sont connues pour leur longévité (plusieurs années). • Synthèse (assemblage des acides aminés en chaîne polypeptidique = protéine): ribosomes Localisation des processus • Processus de dégradation intracellulaire: protéasome et lysosomes 1. Rappel: Information génétique • Protéine = polymère (chaîne) d'acides aminés 50% du poids sec de la plupart des cellules = protéines Nombre total de protéines que peut fabriquer l'organisme humain ??? • Chaque protéine est caractérisée par sa séquence d'acides aminés. Ex. le lysozyme (126 AA) Lys-Val-Phé-Gly-Arg-Cys-Glu-Leu-Ala-Ala-Ala-Met-Lys-Arg-His-Gly-Leu-AspAsn-Tyr-Arg-Gly-Tyr-Ser-Leu-Gly-Asn-Trp-Val-Cys-Ala-Ala-Lys-Phe-Glu-SerAsn-Thr-Gln-Ala-Thr-Asn-Arg-Asn-Thr-Asp-Gly-Ser-Thr-Asp-Tyr-Gly-Ilu-LeuGln-Ilu-Asn-Ser-Arg-Trp-Trp-Cys-Asn-Asp-Gly-Arg-Thr-Pro-Gly-Ser-Arg-AsnLeu-Cys-Asn-Ilu-Pro-Cys-Ser-Ala-Leu-Leu-Ser-Ser-Asp-Ilu-Thr-Ala-Ser-ValAsn-Cys-Ala-Lys-Lys-Ilu-Val-Ser-Asp-Gly-Asp-Gly-Met-Asn-Ala-Trp-Val-TrpArg-Asn-Arg-Cys-Lys-Gly-Thr-Asp-Val-Gln-Ala-Trp-Ilu-Arg-Gly-Cys-Arg-Leu Pour fabriquer une protéine, il faut: • Des acides aminés. • La recette (quels acides aminés il faut assembler et dans quel ordre) Noyau contient une matière appelée chromatine Chromatine = mélange de protéines appelées histones et d'ADN 1.1 Structure de l’ADN (Acide DésoxyriboNucléique) La molécule d ’ADN est composée de 3 types de molécules: • Groupements phosphate • Désoxyribose (sucre à 5 carbones) • Bases azotées: - Purines: Adénine, Guanine (A, G). - Pyrimidines: Thymine, Cytosine (T, C). Sucre Phosphate ADN = polymère de nucléotides Il y a quatre sortes de nucléotides • Adénine • Thymine Désoxyribose Base azotée • Cytosine • Guaninie Les nucléotides peuvent se lier les uns aux autres via le groupement phosphate A avec T : deux liaisons hydrogène (liaisons faibles). C avec G : trois liaisons hydrogène L'orientation entre les liaisons donne une structure en forme de double hélice Dans une cellule humaine : 46 molécules d'ADN Chaque molécule d'ADN s'enroule sur des protéines (histones) et forme un chromosome. ADN Un chromosome = une molécule d'ADN et les protéines sur lesquelles elle s'enroule. Histones L'ensemble des chromosomes forme la chromatine Petite portion d'un chromosome humain 1.2. Le code génétique Le message peut être porté par l'un des deux brins (le brin du bas dans ce cas). N.B. 64 combinaisons pour 20 acides aminés. Code redondant (dégénéré): plusieurs triplets différents peuvent coder pour le même acide aminé. Trois triplets signifient la fin de la recette : triplets STOP Un segment d'ADN portant l'information nécessaire pour la synthèse d'une protéine = gène 1.3. Comparaison ARN/ADN • Polymères de nucléotides • L’ADN a une structure double brin (hélice)/ARN simple brin • Dans l’ARN le nucléotide thymine est remplacé par l’uracile Appariement des bases et Pi stacking dans l'ADN et l'ARN Les chaînes nucléotidiques ont une grande souplesse conformationnelle, ce qui autorise l'apparition de structures complexes. Ces structures (tertiaires) sont dues à l'appariement spécifique des bases par des ponts hydrogènes, trois entre C et G et deux entre A et T ou A et U, mais aussi à la tendance qu'ont les bases à s'empiler les unes sur les autres (« Pi stacking ») grâce aux charges électrostatiques et aux forces de Van der Waals. 1.4. Principe de la transmission de l’information TRADUCT ION • Chaque triplet de bases ADN code pour un triplet de bases ARN (codon). • Un codon code pour un acide aminé • support d'un message codé (ADN, ARNm et ARNt) • détermine la nature de la protéine: - le nombre - l'ordre - l'identité de ses acides aminés • participent activement à la synthèse protéique (ARNr des ribosomes) 1.5. ARN messager • La synthèse des protéines, est dirigée par une matrice: l'ARN messager (ARNm) L ’ARNm: déterminera, grâce à un message codé, la nature, l'ordre et le nombre des acides aminés (parmi un choix de 20 différents), assemblés pour former l'axe polypeptidique de la protéine. • Le code est déchiffrable uniquement dans le sens 5’ vers 3’ • L'identité de chaque acide aminé est donnée par une séquence spécifique de trois nucléotides consécutifs sur l'ARNm: codon. • Les nucléotides du code sont au nombre de quatre : adénine phosphate (A), guanosine phosphate (G), cytosine phosphate (C) et uridine phosphate (U). Ex: AUG code la méthionine, ACC code la thréonine et UCA code la sérine l'ensemble des codons possibles,4 exposant 3 = 64 , est supérieur au nombre d'acides aminés disponibles (20 chez les Eucaryotes), si bien qu'un même acide aminé peut être codé par plusieurs codons : si le tryptophane n'a que le seul codon UGG, la glycine peut être codée par les combinaisons GGU, GGC, GGA ou GGG. Pour faire référence à cette caractéristique, les anglo-saxons parlent de « degenerate code ». Etant donné qu'on dispose de 20 acides aminés, le code à trois lettres paraît être le plus cohérent (optimum). En effet, le code à deux lettres serait insuffisant, car ne permettant que 16 combinaisons (4 exposant 2). A l'inverse, le code à quatre lettres, permettant 256 combinaisons (4 exposant 4) serait excessif, rendant inutilement long le génome codant. Le code est universel : il est utilisé par tous les organismes, animaux, végétaux, champignons, bactéries et virus. Cependant, des codons légèrement différents peuvent exister chez les mitochondries et certaines bactéries. 1.6. Organisation des génomes • Le séquençage du génome humain a démontré l'existence d'environ 40 000 gènes (qui ne représentent que 1,5% de la quantité totale de l'ADN du noyau). • Ces 40 000 gènes sont à l'origine de la synthèse d'environ 200 000 protéines différentes (amplification). Billion = Milliard • La taille des génomes n’est pas proportionnelle à la complexité des organismes • Présence de séquences « non codantes » (dépourvue de gènes) Virus/organisme Taille du génome (paire de base) 2. Transcription Une zone de l’ADN se relaxe (déroule). L’information génétique portée par l’ADN est transcrite en l’ARN messager (ARNm). ADN TRANSCRIPTION ARN L’ARNm migre du noyau vers le cytoplasme où il s’associe aux ribosomes. Noyau Acides aminés ARNt ARN Ribosome Cytoplasme Protéine TRADUCTION L’information portée par l’ARNm est traduite en protéine: conversion de l’information génétique en séquence d’acides aminés spécifique synthétise de la protéine. Rq: La traduction au niveau des ribosomes necessite des ARNs de transfert (ARNt) 2.1. Principales étapes • La similarité de structure chimique entre l’ADN et l’ARN permet leur association via leurs nucléotides synthèse du transcrit ARNm • Une région de l’hélice ADN se relaxe (déroule) • Des nucléotides ARN viennent s’associer à l’ADN par complémentarité Rq: l’ARN polymérase relaxe l’ADN et ajoute les nucléotides ARN à l’ARNm en cours de synthèse. • Au fur et à mesure de leur synthèse, les nucléotides de l’ARNm se sépare de l’ADN. L’ADN se referme après que l’ARNm soit transcrit • Lorsque la transcription de l’ARN est terminée le brin d’ARNm se libère de • Les 3 étapes de la transcription: - Initiation - Elongation - Terminaison • Des signaux contrôlent les sites où l’ARN polymerase débute et stoppe la transcription de l’ADN. Gene A Gene B TRANSCRIPTION TRANSCRIPTION L’initiation de transcription est le principal point de contrôle 2.3. ARN polymerases 2.3.1. Classification • 3 types d’ARN polymerases (chez l’humain) qui synthetisent 3 types d’ARN Polymerase Produit I rRNA II précurseur d ’ARNm III RNAt, small RNA Regulation simple diverses simple Types d’ARN Fonction mRNAs code pour des protéines rRNAs protéines composant des ribosomes, catalyse la synthèse des tRNAs adaptateurs entre les ARNm et les acides aminés snRNAs Epissage alternatif (small nuclear RNA) Rôle des différents ARNs Type d’ARN Fonctionne dans ARN messager (ARNm) ARN de transfert (ARNt) ARN ribosomal (ARNr) Fonction Noyau, migre dans le cytoplasme (ribosomes) Transporte l’information de la séquence ADN vers le ribosome Cytoplasme Lie l’ARNm avec les acides aminés Cytoplasme Structure des ribosomes 2.3.2. Fonctionnement de l’ARN polymerase II • Utilise l’ADN simple brin comme matrice • Ne nécessite pas d’amorces • Synthétise l’ARN de 5’ vers 3’(unidirectionnel) • L’ADN duplex est désenroulé en amont et ré-enroulé en aval de la “bulle” de transcription • La transcription implique de nombreuses enzymes et protéines 2.4. Initiation de la transcription La sélection du segment d’ADN à transcrire est réalisées par la formation d’un complexe d’initiation au niveau d’un promoteur Promoteur: petite region d’une séquence d’ADN qui permet la liaison de l’ARN polymerase pour initier la transcription. Sequences consensus du promoteur E. coli 5’………TATTGACA………………TATAAT……Start site -35 -10 +1 Le facteur sigma chez E. coli interagit avec la séquence comprise entre –35 and –10 au niveau des promoteurs afin de selectionner les gènes à transcrire 2.4.1. Promoteur et séquences consensus L’ARNm s’allonge de l’extrémité 3’ vers l’extrémité 5’ Le brin codant est lu de 5’ 3’ Site initiation de transcription +1 Brin codant L’initiation de la transcription nécessite des séquences consensus : séquence de nucléotides conservée entre différents gènes ex: TATAA box Séquence consensus d’initiation de transcription (E.Coli) Principales séquences consensus chez les eucaryotes: TATA box et Initiateur (Inr). Y= Cytosine ou Thymine . N est un nucléotide indifférent • Certains gènes peuvent avoir un Initiateur mais pas de TATA box dans leur promoteur et vice versa. • TATA box est reconnue par TBP; Inr est reconnue par TFIID • Les séquences régulatrices en amont sont reconnues par des facteurs de transcription 2.5. Elongation et termination • Une fois le l’ARN pol s’éloigne du promoteur, la chaine ARN s’allonge et adopte une nouvelle structure en s’associant avec de nouvelles proteines: facteurs d’élongation. • La Termination chez E. coli est controlée par des séquences de terminaison et des protéines accessoires tel que le facteur Rho. Lorsque la séquence de terminaison est transcrite, elle forme un “hairpin” (tête d’épingle), region riche en GC suivie de résidus U • La Termination chez les eucaryotes est moins bien connue. a. Pour la plupart des ARNm, pol II genere un transcrit plus long que l’ARNm mature (3’) b. la Termination est probablement couplée au “traitement” de cette extremité 3’ supplémentaire . Reconnaissance d’une séquence de clivage (AAUAAA------GC ou U rich) par des complexes enzymatiques qui vont cliver cette extremité et assurer polyadenylation. Ce processus signifie au complexe Pol II de se séparer de la matrice ADN et de terminer la transcription. 3. Traduction La conversion en protéine du message codé par l'ARNm, nommée processus de traduction, est catalysée par un grand complexe d'ARN et de protéines, formant une particule visible en microscopie électronique : le ribosome. 3.1. Initiation de la traduction • Reconnaître le point de départ du message codé porté par l'ARNm: codon AUG. • Formation préalable d'un complexe de pré-initiation, formé de la petite sous-unité (40 S), de l'ARNt de la méthionine ( ARNt meth initiateur) et du facteur d'initiation eIF–2. • Le complexe de pré-initiation reconnaît la tête (5 ’) de l'ARNm (présence de plusieurs facteurs d'initiation se fixant soit à la tête de l'ARNm soit à la petite sous-unité (40 S)). • L'un des facteurs d'initiation, à activité hélicase, aura pour fonction de linéariser la molécule d'ARNm: déplacement du complexe de pré-initiation le long de l'ARNm (à la recherche du codon de départ). • Grâce à la présence de l ’arnt meth initiateur qui porte l'anticodon 3 ’–UAC–5 ’, le complexe de pré-initiation trouve le codon de départ 5 ’–AUG–3 ’. • Le GTP lié à eIF–2gamma est alors hydrolysé: dissociation des facteurs d'initiation et association de la grande sous-unité à la petite. L'ARNm est alors pris entre les deux sous-unités: coulisse par rapport au ribosome. 3.2. Elongation de la traduction • Les ARNs de transfert (ARNt) possèdent d’un coté un site de fixation pour un acide aminé et de l ’autre un anticodon (triplet de nucléotides) Acide aminé • Les ARNt assurent la conversion de l’information génétique en polypeptide. • La traduction s’opère au niveau du ribosome Chaque ARNt est spécifique d’un acide aminé Anticodon 3.2.1. Structure des ribosomes Elongation de la chaîne peptidique ARNt + acide aminé • Les ribosomes sont composés de 2 sous unités qui s’associent lors de la traduction. • La grande sous-unité possède 2 sites de fixation des ARNt: site A et P 3.2.2. Structure des ARN de transfert Une extrémité de l’ARNt fixe un acide aminé spécifique Site de fixation à l’acide aminé Site de fixation à l’ARNm Une extrémité de l’ARNt est spécifique d ’un codon 1. Un transcrit ARNm se fixe sur la petite sous unité du ribosome et le premier ARNt se fixe. Le codon AUG de l’ARNm est la séquence « initiation » de traduction du polypeptide. 3. La grande sous-unité du ribosome vient s’associer au ribosome 2. L’ARNt qui porte la méthionine (met) se fixe sur le codon AUG 4. Le deuxième ARNt qui porte la Leucine vient s’apparier à l ’ARNm 5. Une liaison entre la leucine et la méthionine forme une chaîne polypeptidique. 7. Le ribosome se déplace le long de l’ARNm. L’ARNt qui porte la leucine se fixe sur le site P et libère donc le site A. 6. L’ARNt fixé au site P est libéré 8. Un nouvel ARNt (Thre) correspondant au codon suivant sur l’ARNm se fixe sur le site A et ainsi de suite: élongation de la chaîne polypeptidique 3.2.3. Polysomes Un transcrit ARNm peut être traduit par de nombreux ribosomes (polysomes) production de nombreuses copies de la même protéine. ARNm polypeptides polypeptides Ribosome ARNm Ribosome 4. Terminaison de la traduction La translocation s'effectue jusqu'à l'un des codons stop, UAA, UAG ou UGA, qui est lié à une protéine appelée facteur de terminaison de l'élongation (eTF), elle-même associée au GTP. Aucun autre acide aminé ne peut plus être ajouté, et la traduction est terminée par l'hydrolyse de la liaison du dernier acide aminé avec son ARNt, formant ainsi l'extrémité carboxy terminale de la protéine. La chaîne protéique alors complète est libérée et les deux sous-unités du ribosome se dissocient libérant ainsi l'ARNm. 5. Epissage alternatif de l’ARN Epissage Des enzymes spécialisées vont éliminer des régions non codantes de l’ARNm (introns) et « recollent » les régions codantes (exons) ensemble afin de former un transcrit « édité » (épissé) Transcrit ARNm Des enzymes éliminent les introns Transcrit ARNm édité (épissé) Protéine fonctionnelle Gène (triose phosphate isomérase) Intron Transcription + épissage ARNm épissé Queue polyA (polyadéndylation) Protéine L’ARNm se caractérise en 3’ par la présence d’une « queue polyA »