Module d'Ingénierie des Protéines : Bi 231 Plan du cours (12 séances CM+TD de 1h30). I. Introduction sur les objectifs de ce module et rappels. 11 –Objectifs du module : 12 –Rappels : Propriétés physico-chimiques des protéines (aa, pI, spectre d'absorption), structure II, III et IV des protéines, modifications post-traductionnelles 13 –Rôles des Protéines in vivo. II. Purification des protéines. 21 –Buts. 22 –Moyens. 23 –Origine de la protéines. 24 –Méthodes de caractérisation. III. Surexpression d'une protéine. 31 –Cahier des charges. 32 –Expression chez E. coli - Avantages. - Organisation générale d'un vecteur - Exemple d'un systéme d'expression. - Les différentes souches de E. coli existantes - Les paramètres ajustables lors d'une surexpression 33 –Autres hôtes bactériens : avantages et inconvénients. 34 –Expression chez la levure : Hôtes et vecteurs disponibles. 35 –Expression dans des cellules Eucaryotes supérieures animales et végétales. IV. Mutagenèse: techniques et applications. 41 –Mutagenèse aléatoire. 42 –Alanine scanning. 43 –Mutagenése dirigée. V. L'insuline : exemple d'une stratégie. 51 –Introduction sur Insuline : Rôles, fonctionnement, structure, enjeux médicaux. 52 –Historique : de Banting à Sanger 53 –Les stratégies actuelles : contraintes et spécificités. VI. Analyse d'articles. Chaque étudiant, par groupe de 4-5, devra faire une présentation orale d'articles parmi la liste de thème suivant : - Etude de senseurs à gaz (O2,NO,CO). - Effet de mutations sur la fonction de protéines chaperons. Liste des acides aminés : Acide aminé : Symboles : pK - COOH : pK - NH2 : pK - R : Polarité : Alanine Ala A 2,35 9,87 Arginine Arg R 1,82 8,99 Asparagine Asn N 2,14 8,72 Acide aspartique Asp D 1,99 9,9 3,9 chargé Cystéine Cys C 1,92 10,7 8,37 polaire Glutamine Gln Q 2,17 9,13 Acide glutamique Glu E 2,1 9,47 Glycine Gly G 2,35 9,78 Histidine His H 1,8 9,33 Isoleucine * Ile I 2,32 9,76 apolaire 12,48 chargé polaire polaire 4,07 chargé apolaire 6,04 chargé apolaire apolaire Leucine * Leu L 2,33 9,74 Lysine * Lys K 2,16 9,06 Méthionine * Met M 2,13 9,28 apolaire Phénylalanine * Phe F 2,2 9,31 apolaire Proline Pro P 1,95 10,64 apolaire Sérine Ser S 2,19 9,21 polaire Thréonine * Thr T 2,09 9,1 polaire Tryptophane * Trp W 2,46 9,41 apolaire Tyrosine Tyr Y 2,2 9,21 Valine * Val V 2,29 9,74 10,54 10,46 chargé polaire apolaire * = les 8 acides aminés essentiels Autres acides aminés : Bêta-Alanine, Carnitine (métabolisme mitochondrial),Citrulline (métabolisme de l'ammoniaque), Acide Gamma-Aminobutyrique (GABA) (neurotransmetteur), Glutathion, Hydroxyproline, Ornithine (cycle de l'urée), Taurine (métabolisme biliaire). Renseignements complémentaires : http://www.biochimie.univ-montp2.fr/licence/qabs/peptides/ac_amine.htm Modifications post traductionnelles Fonction (a) à la régulation de l'activité des protéines (b) à leur étiquettage pour qu'elles soient reconnues par des partenaires métaboliques ou par des systèmes de dégradation (c) à les ancrer dans une membrane (d) à les faire participer à des cascades de signalisation (e) à leur adressage pour qu'elles se rendent au bon endroit dans la cellule (f) à définir une identité immunologique (comme les groupes sanguins) etc, etc. Liste partielle des modifications post-traductionnelles qu'on peut rencontrer dans une protéine. Ajout ou retrait de groupements divers: - acétylation (p.e. sur les histones; sur le N-terminus ou sur une lysine) - amidation (plusieurs neuropeptides et hormones peptidiques; sur le C-terminus) - biotinylation (pyruvate carboxylase; sur une lysine) - carboxylation (prothrombine, sur un acide aspartique) - hydroxylation (collagène; sur une lysine, une proline) - méthylation (calmoduline, cytochrome C; sur une lysine) - phosphorylation (AP-1; surtout Y, S, T, mais aussi sur H et D) - sulfatage (gastrine; sur une tyrosine) Acylation, ou ajout d'acides gras divers: - glypiation: liaison entre une protéine destinée à la surface extracellulaire et une ancre de glycophosphatidylinositol (ou GPI). - isoprénylation: liaison entre un résidu cystéine C-terminal et l'un de deux composés isoprènes, le farnésyl ou le géranylgéranyl. - S-acylation: liaison entre une cystéine interne et un acide gras (acide palmitique ou acide myristique). La liaison oxyester simple entre l'acide gras et une sérine interne (O-acylation) est aussi observée - Myristoylation N-terminale: Modification co-traductionnelle d'une glycine N-terminale par formation d'un lien amide amide avec l'acide myristique sous forme de myristoyl-CoA. - Ancrage à la membrane par protéolyse contrôlée et ajout de cholestérol (comme avec le récepteur membranaire hedgehog). Ajouts de glucides, simples ou complexes: - c-mannosylation - poly-ADP-ribosylation - acétylglucosamination Ajout de polypeptides: - ubiquitination (couplage à l'ubiquitine: histones, aussi toute protéine appelée à être dégradée par le sentier métabolique du protéasome 26S; sur une lysine). - sumoylation (couplage du small ubiquitin-like modifier, ou SUMO: se produit chez p53, PML; sur une lysine). Pour en savoir plus : http://www.callisto.si.usherb.ca/~bcm514/3.html Structure des protéines Feuillet Hélice Structure III Classification CATH (Class(C), Architecture(A), Topology(T) and Homologous superfamily (H).) http://www.biochem.ucl.ac.uk/bsm/cath/ Rôle des Protéines in vivo • • • • • • • • • Structure Transport Stockage Fixation Catalyseur Mécanique Signalisation Capteur Immunité • • • • • • • • • kératine hemoglobine Ferrétine Enzyme Myosine Hormones Guanylate cyclase anticorps II. Purification des protéines. En fonction de ce cahier des charges, détermination du couple vecteur-hôte Hôtes : Vecteurs : • Bactéries : • plasmides : ADNdb circulaire - E. coli • bactériophages (=virus des - autres (L. lactis) bactéries) • Levure (S. cerevisiae, S. • Bacculovirus pombe, ...) • Sindbis Virus • Cellules animales (insectes, • Virus de la vaccine mammifères). • EBV • Cellules végétales et • TMV végétaux (Arabidopsis, OGM). Selon : • Charge, pI • Masse moléculaire • Affinité • Hydrophobicité/ polarité • Volume → Electrophorèse,et chromato échangeuse d’ions →SDS PAGE et masse →Chromato d’affinité →Chromato hydrophobe et phase inverse →Tamis moléculaire =gel filtration III. Surexpression d'une protéine. 31 –Cahier des charges. 32 –Expression chez E. coli - Avantages. - Organisation générale d'un vecteur - Exemples de systèmes d'expression. - Les différentes souches de E. coli existantes - Les paramètres ajustables lors d'une surexpression 33 –Autres hôtes bactériens : avantages et inconvénients. 34 –Expression chez la levure : Hôtes et vecteurs disponibles. 35 –Expression dans des cellules Eucaryotes supérieures animales et végétales. ESCHERICHIA COLI Minidéfinition : entérobactérie de l'intestin et de l'environnement humain ou animal (tube digestif). Responsables d'infections spontanées des voies urinaires et de gastro-entérites. Responsables aussi d'infections nosocomiales. C'est la bactérie pathogène la plus fréquemment retrouvée. Tendance vers l'acquisition de résistance aux antibiotiques. ECOLOGIE Les Escherichia coli ou colibacilles sont des hôtes normaux de l'intestin : ils représentent près de 80 % de la flore intestinale aérobie de l'adulte (flore sous-dominante, car la flore dominante est à 99 % anaérobie). On peut les retrouver également au niveau de diverses muqueuses chez l'Homme et chez les animaux. Le nouveau-né est ensemencé lors de l'accouchement par contact avec la flore cutanée; périnéale qui provient de la flore fécale. La flore buccale de l'enfant nouveau-né comporte régulièrement Escherichia coli, la colonisation rapide du tube digestif en découle. Cet ensemencement est proportionnel à la durée de l'accouchement, en particulier au délai entre la rupture des membranes et la naissance, il est tout à fait inévitable dans les conditions naturelles. L'acquisition d'Escherichia coli est aussi inévitable à court terme pour les enfants nés par césarienne. Dans ce cas la contamination initiale est apportée par le contact avec la mère ou le personnel et provient essentiellement d'autres nouveau-nés porteurs du germe. La mère transmet à l'enfant ses variétés personnelles d'Escherichia coli et le portage intestinal sera dès lors continu. La présence d'Escherichia coli est ainsi constante mais ce ne sont pas les souches initiales qui perdureront. Le ou les quelques types sérologiques (l'espèce considérée peut être subdivisée en types sérologiques selon la composition chimique de la surface bactérienne) varieront au cours de la vie, en grande partie du fait de la rencontre de l'individu avec des sources extérieures de ce germe. Les repas pris à la maison avec une certaine monotonie agissent comme stabilisant sur la composante Escherichia coli de la flore fécale ; a contrario des variations de régime (vacances exotiques ou séjour à l'hôpital) peuvent profondément modifier le contenu en colibacilles de l'intestin et permettre l'implantation de types sérologiques jusqu'alors absents, ou l'émergence d'un nouveau type sérologique dominant. La présence des Escherichia coli dans le milieu environnant ou dans les aliments signe une contamination fécale, mais pas obligatoirement une contamination humaine : tous les animaux à sang chaud abritent Escherichia coli. Exemple de vecteur • Topoisomerized vector for 5-minute TOPO® Cloning of Taq-generated PCR products • Enterokinase cleavage site to remove thioredoxin after protein purification (if desired) • C-terminal V5 epitope for detection and analysis with the Anti-V5 antibodies • C-terminal 6xHis tag for rapid purification with ProBond™ resin and detection with the Anti-His(Cterm) antibodies Souches de Escherichia coli Souches But recherché BL21 Amplification/ Stabilité des plasmides Expression de protéines souche DE3 DH5 DH10 TOP10 souche -E souche B-T1R souche F' DH5αF´IQ™ - Exemple : souche BL21 DE3 : F ompT hsdSB (rB-, mB-) gal dcm rne131 (DE3) - F : pas de gène pour pillus; ompT: déficit en une protéase ; hsdSB (rB-, mB-) déficit en une endonucléase ; ... 34 –Expression chez la levure : 4 espèces : Saccharomyces cerevisiae Pichia pastoris Pichia methanolica Schizosaccharomyces pombe Avantages : Culture aisée Modifications post-traductionnelles Systèmes d'expression Génétique maîtrisée Inconvénients : Modifications post-trad° différente de humaine Certaines protéines mammifères sont toxiques Exemples de type cellulaire animale utilisé pour la surexpression de protéines Cell Line Name Organism Type Tissue COS-7 Primate - Non Human Kidney HEK 293 Human Kidney Sf9 Insect Ovary High 5 (BTI-Tn-5B1-4) Insect Embryo HAS-P Mouse Breast/Mammary RAW 264.7 cells, Murine Macrophage Cells in vivo mouse brain Mouse Macrophage Mouse Bone Cellules Mammifères Cellules Mammifères • Cellules de singes, souris, lapin, ... • Cellules humaines immortalisées + modifications post-traduct ±identique à homme - milieu riche avec interleukines et hormones de croissance coût +++ - expression peu efficace Cellules Mammifères • Cellules humaines non mortalisées + cellules saines + modifications post-traduct OK - milieu riche avec interleukines et hormones de croissance coût +++ - expression peu efficace interaction protéines-protéine in vivo réinjection possible = thèrapie génique voies de signalisation, effet in vivo = cellules cancéreuses + modifications post-traduct OK - milieu riche avec interleukines et hormones de croissance coût +++ - expression peu efficace Expression d'anticorps monoclonaux voies de signalisation, effet in vivo Cellules Mammifères • Comment transfectées ces cellules ? 1) Utilisation de virus modifié (in vivo / in vitro ) (Vaccine, EBV,...) efficacité OK mais problème : - d'insertion aléatoire (cf "bébé-bulle") - persistance de l'expression (mucovicidose) - réaction immunitaire spécifique (mucovicidose) 2) Electroporation (in vitro uniquement) : - efficacité faible et mortalité élevée - persistance expression + non immunogène 41 Mutagenèse aléatoire. Objectifs : modification du phénotype, recherche de la mutation associée Moyens : • irradiations (UV, RX), • produits chimiques • utilisation de DNApol modifiée Agents mutagènes • Irradiations modification d'une ou plusieurs bases • produits chimiques : • DNApol modifiée, suppression de la fonction exonucléasique pas de correction possible (exple fragment kleenow, MutaGen™ ) Insuline Régulation de la glycémie chez les mammifères : Rôle + du glucagon relargage par le foie Rôle – de l'insuline Absorption cellulaire du glucose notamment par adipocytes • Diabète de type I : déficit de production de l'insuline. • Due à réaction autoimmune : Ac ilôts de Langerhans hyperglycémie coma mort • • 10% des diabétiques • Apparition favorisée par infection par certains virus (EBV,...), traitement médicaux, chirurgicaux. Diabète de type II : problème de transduction du signal sur cellules réceptrices. • Due à mauvaise alimentation + terrain génétique. hyperglycémie chronique problèmes cardiaques, visuels,rénaux, neurologiques, ... • 90% des diabétiques. •Chez sujets adultes, agés • Apparition multifactorielle : génétique, alimentaire, autoimmune (Ac insuline-recepteur),... Structure de l'insuline • Formée de 2 chaînes, A et B • synthétisée sous forme de proinsuline Préproinsuline humaine peptide signal peptide B :31 aa FVNQHLCGSHLVEALYLVCGERGFFYTPKT D fSL peptide C peptide A : 20 aa GIVEQCCTSICSLYQLENYCN L RREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKR H L Dates importantes de l'histoire de l'insuline • • • • • • • • • • • • • 1889 : Ablation du pancréas induit un diabète chez le chien. 1908 : Restauration de la glycémie par injection d'extrait de pancréas chez chien sans pancréas. 1921 : Extraction d'une hormone antidiabétique simultanément par 2 équipes : Bucarest (Paulesco), Toronto (Banting & Macleod). 1922 : premiers patients traités et sauvés à Toronto 1923 : Banting & Macleod : prix Nobel de médecine 1925-1970 : amélioration de la pureté et des formulations (1ère insuline retard par ajout de Zn, protamine) 1926 :cristallisation de l'insuline 1958 : détermination de la structure chimique de l'insuline (1ère protéine séquencée): prix Nobel de chimie pour Sanger. 1967 : Séquence de la proinsuline. 1969 : Structure 3D de l'insuline. 197n : "humanisation" de l'insuline porcine. 1982 : production d'insuline recombinante. 1983 Amélioration du procédé Purification de l'insuline: A partir de pancréas • Le pancréas est découpé en morceaux, • Suspendu dans ethanol à pH 2 (inactivation de la trypsine), • neutralisation / CaCO3, • précipitation par sels (KCl, NaCl, SO4(NH4)2, ...), • resuspension dans eau et précipitation par acidification • + chromatographie : Gel filtration et/ou échangeuse d'ions Surproduction d'insuline. • Production séparée des chaînes A et B chez E. coli. Les peptides étaient co-exprimés avec autre protéine (-gal, TrpE, ...). • séparation /protéolyse • 2A +1B sulfoné (cys-SO2) + mercaptoethanol, 24H 60 % rendemment. • purification / chromatographie phase inverse Conversion d'insuline porcine. = remplacement AlaThr • purification insuline (cf précédent), • conversion : insuline (porc) + Trypsine + thréonine ester dans eau+solvant organique (diminue activité peptidase de trypsine et favorise la réaction inverse), rendement <97 % • Purification par chromatographie(s) Surproduction de proinsuline. sur expression chez E. coli (1982) • insertion du cDNA de la préproinsuline dans une vecteur bactérien. • surproduction avec protéine de fusion (idem). • coupure / protéase proinsuline • oxydation des cystéines • repliement de la protéine en présence de réducteurs. • coupure par protéase spécifique • purification par chromatographie Surproduction de proinsuline. sur expression chez S. cerevisiae (1988) • insertion du cDNA de la préproinsuline dans une vecteur de levure. • surproduction avec protéine de fusion (idem). • coupure / protéase proinsuline insuline • purification par chromatographies Masters existants Ingénierie Structurale et Fonctionnelle des Biomolécules (Paris Sud) http://www.lebs.cnrs-gif.fr/master/master.html Structures, Protéome et Génomique Fonctionnelle (Paris 7) http://www.biochimiep7.jussieu.fr/enseignement/master_spgf.html MASTER SCIENCES, TECHNOLOGIES et SANTÉ (Grenoble) http://www.ujf-grenoble.fr/ujf/fr/formation/lmd/livret/Master/domaine-sciences-technologiessante/master-sciences-vivant/M2/M2biostructuralenano.pdf Master Sciences et Technologies Mention Biologie Santé (Bordeaux) http://www.ubordeaux1.fr/biologie/formations/master/biochimie_structurale/master_recherche_bioch_struc t_interface.htm http://www.ufrsdv.u-bordeaux2.fr/formation/initiale/MRbiochstru.htm BIOCHIMIE STRUCTURALE ET FONCTIONNELLE (Lyon) http://biochimie.univ-lyon1.fr/Presentation_Master_Recherche.pdf Biochimie structurale, bio-informatique et génomique (Marseille) http://www.univ-aixmarseille.fr/scuio.htm?scuio=34