Structure des protéines

publicité
Module d'Ingénierie des Protéines : Bi 231
Plan du cours (12 séances CM+TD de 1h30).
I. Introduction sur les objectifs de ce module et rappels.
11 –Objectifs du module :
12 –Rappels : Propriétés physico-chimiques des protéines (aa, pI, spectre d'absorption),
structure II, III et IV des protéines, modifications post-traductionnelles
13 –Rôles des Protéines in vivo.
II. Purification des protéines.
21 –Buts.
22 –Moyens.
23 –Origine de la protéines.
24 –Méthodes de caractérisation.
III. Surexpression d'une protéine.
31 –Cahier des charges.
32 –Expression chez E. coli
- Avantages.
- Organisation générale d'un vecteur
- Exemple d'un systéme d'expression.
- Les différentes souches de E. coli existantes
- Les paramètres ajustables lors d'une surexpression
33 –Autres hôtes bactériens : avantages et inconvénients.
34 –Expression chez la levure : Hôtes et vecteurs disponibles.
35 –Expression dans des cellules Eucaryotes supérieures animales et végétales.
IV. Mutagenèse: techniques et applications.
41 –Mutagenèse aléatoire.
42 –Alanine scanning.
43 –Mutagenése dirigée.
V. L'insuline : exemple d'une stratégie.
51 –Introduction sur Insuline : Rôles, fonctionnement, structure, enjeux médicaux.
52 –Historique : de Banting à Sanger
53 –Les stratégies actuelles : contraintes et spécificités.
VI. Analyse d'articles.
Chaque étudiant, par groupe de 4-5, devra faire une présentation orale d'articles parmi la liste
de thème suivant :
- Etude de senseurs à gaz (O2,NO,CO).
- Effet de mutations sur la fonction de protéines chaperons.
Liste des acides aminés :
Acide aminé :
Symboles : pK - COOH :
pK - NH2 :
pK - R :
Polarité :
Alanine
Ala
A
2,35
9,87
Arginine
Arg R
1,82
8,99
Asparagine
Asn N
2,14
8,72
Acide
aspartique
Asp D
1,99
9,9
3,9
chargé
Cystéine
Cys C
1,92
10,7
8,37
polaire
Glutamine
Gln Q
2,17
9,13
Acide
glutamique
Glu E
2,1
9,47
Glycine
Gly G
2,35
9,78
Histidine
His
H
1,8
9,33
Isoleucine *
Ile
I
2,32
9,76
apolaire
12,48
chargé
polaire
polaire
4,07
chargé
apolaire
6,04
chargé
apolaire
apolaire
Leucine *
Leu L
2,33
9,74
Lysine *
Lys
K
2,16
9,06
Méthionine *
Met M
2,13
9,28
apolaire
Phénylalanine * Phe F
2,2
9,31
apolaire
Proline
Pro
P
1,95
10,64
apolaire
Sérine
Ser
S
2,19
9,21
polaire
Thréonine *
Thr
T
2,09
9,1
polaire
Tryptophane *
Trp
W
2,46
9,41
apolaire
Tyrosine
Tyr
Y
2,2
9,21
Valine *
Val
V
2,29
9,74
10,54
10,46
chargé
polaire
apolaire
* = les 8 acides aminés essentiels
Autres acides aminés :
Bêta-Alanine, Carnitine (métabolisme mitochondrial),Citrulline (métabolisme de l'ammoniaque),
Acide Gamma-Aminobutyrique (GABA) (neurotransmetteur), Glutathion, Hydroxyproline,
Ornithine (cycle de l'urée), Taurine (métabolisme biliaire).
Renseignements complémentaires :
http://www.biochimie.univ-montp2.fr/licence/qabs/peptides/ac_amine.htm
Modifications post traductionnelles
Fonction
(a) à la régulation de l'activité des protéines
(b) à leur étiquettage pour qu'elles soient reconnues par des partenaires métaboliques ou par
des systèmes de dégradation
(c) à les ancrer dans une membrane
(d) à les faire participer à des cascades de signalisation
(e) à leur adressage pour qu'elles se rendent au bon endroit dans la cellule
(f) à définir une identité immunologique (comme les groupes sanguins) etc, etc.
Liste partielle des modifications post-traductionnelles qu'on peut
rencontrer dans une protéine.
Ajout ou retrait de groupements divers:
- acétylation (p.e. sur les histones; sur le N-terminus ou sur une lysine)
- amidation (plusieurs neuropeptides et hormones peptidiques; sur le C-terminus)
- biotinylation (pyruvate carboxylase; sur une lysine)
- carboxylation (prothrombine, sur un acide aspartique)
- hydroxylation (collagène; sur une lysine, une proline)
- méthylation (calmoduline, cytochrome C; sur une lysine)
- phosphorylation (AP-1; surtout Y, S, T, mais aussi sur H et D)
- sulfatage (gastrine; sur une tyrosine)
Acylation, ou ajout d'acides gras divers:
- glypiation: liaison entre une protéine destinée à la surface extracellulaire et une ancre de
glycophosphatidylinositol (ou GPI).
- isoprénylation: liaison entre un résidu cystéine C-terminal et l'un de deux composés
isoprènes, le farnésyl ou le géranylgéranyl.
- S-acylation: liaison entre une cystéine interne et un acide gras (acide palmitique ou acide
myristique). La liaison oxyester simple entre l'acide gras et une sérine interne (O-acylation)
est aussi observée
- Myristoylation N-terminale: Modification co-traductionnelle d'une glycine N-terminale par
formation d'un lien amide amide avec l'acide myristique sous forme de myristoyl-CoA.
- Ancrage à la membrane par protéolyse contrôlée et ajout de cholestérol (comme avec le
récepteur membranaire hedgehog).
Ajouts de glucides, simples ou complexes:
- c-mannosylation - poly-ADP-ribosylation - acétylglucosamination
Ajout de polypeptides:
- ubiquitination (couplage à l'ubiquitine: histones, aussi toute protéine appelée à être dégradée
par le sentier métabolique du protéasome 26S; sur une lysine).
- sumoylation (couplage du small ubiquitin-like modifier, ou SUMO: se produit chez p53,
PML; sur une lysine).
Pour en savoir plus : http://www.callisto.si.usherb.ca/~bcm514/3.html
Structure des protéines
Feuillet 
Hélice 
Structure III
Classification CATH (Class(C), Architecture(A), Topology(T) and Homologous superfamily
(H).)
http://www.biochem.ucl.ac.uk/bsm/cath/
Rôle des Protéines in vivo
•
•
•
•
•
•
•
•
•
Structure
Transport
Stockage
Fixation
Catalyseur
Mécanique
Signalisation
Capteur
Immunité
•
•
•
•
•
•
•
•
•
kératine
hemoglobine
Ferrétine
Enzyme
Myosine
Hormones
Guanylate cyclase
anticorps
II. Purification des protéines.
En fonction de ce cahier des charges,
détermination du couple vecteur-hôte
Hôtes :
Vecteurs :
• Bactéries :
• plasmides : ADNdb circulaire
- E. coli
• bactériophages (=virus des
- autres (L. lactis)
bactéries)
• Levure (S. cerevisiae, S.
• Bacculovirus
pombe, ...)
• Sindbis Virus
• Cellules animales (insectes,
• Virus de la vaccine
mammifères).
• EBV
• Cellules végétales et
• TMV
végétaux (Arabidopsis,
OGM).
Selon :
• Charge, pI
• Masse moléculaire
• Affinité
• Hydrophobicité/
polarité
• Volume
→ Electrophorèse,et
chromato échangeuse
d’ions
→SDS PAGE et masse
→Chromato d’affinité
→Chromato hydrophobe
et phase inverse
→Tamis moléculaire
=gel filtration
III. Surexpression d'une protéine.
31 –Cahier des charges.
32 –Expression chez E. coli
- Avantages.
- Organisation générale d'un vecteur
- Exemples de systèmes d'expression.
- Les différentes souches de E. coli existantes
- Les paramètres ajustables lors d'une surexpression
33 –Autres hôtes bactériens : avantages et inconvénients.
34 –Expression chez la levure : Hôtes et vecteurs
disponibles.
35 –Expression dans des cellules Eucaryotes supérieures
animales et végétales.
ESCHERICHIA COLI
Minidéfinition : entérobactérie de l'intestin et de l'environnement humain ou animal (tube
digestif). Responsables d'infections spontanées des voies urinaires et de gastro-entérites.
Responsables aussi d'infections nosocomiales. C'est la bactérie pathogène la plus
fréquemment retrouvée. Tendance vers l'acquisition de résistance aux antibiotiques.
ECOLOGIE
Les Escherichia coli ou colibacilles sont des hôtes normaux de l'intestin : ils représentent près
de 80 % de la flore intestinale aérobie de l'adulte (flore sous-dominante, car la flore
dominante est à 99 % anaérobie). On peut les retrouver également au niveau de diverses
muqueuses chez l'Homme et chez les animaux. Le nouveau-né est ensemencé lors de
l'accouchement par contact avec la flore cutanée; périnéale qui provient de la flore fécale. La
flore buccale de l'enfant nouveau-né comporte régulièrement Escherichia coli, la colonisation
rapide du tube digestif en découle. Cet ensemencement est proportionnel à la durée de
l'accouchement, en particulier au délai entre la rupture des membranes et la naissance, il est
tout à fait inévitable dans les conditions naturelles. L'acquisition d'Escherichia coli est aussi
inévitable à court terme pour les enfants nés par césarienne. Dans ce cas la contamination
initiale est apportée par le contact avec la mère ou le personnel et provient essentiellement
d'autres nouveau-nés porteurs du germe. La mère transmet à l'enfant ses variétés personnelles
d'Escherichia coli et le portage intestinal sera dès lors continu. La présence d'Escherichia coli
est ainsi constante mais ce ne sont pas les souches initiales qui perdureront. Le ou les
quelques types sérologiques (l'espèce considérée peut être subdivisée en types sérologiques
selon la composition chimique de la surface bactérienne) varieront au cours de la vie, en
grande partie du fait de la rencontre de l'individu avec des sources extérieures de ce germe.
Les repas pris à la maison avec une certaine monotonie agissent comme stabilisant sur la
composante Escherichia coli de la flore fécale ; a contrario des variations de régime (vacances
exotiques ou séjour à l'hôpital) peuvent profondément modifier le contenu en colibacilles de
l'intestin et permettre l'implantation de types sérologiques jusqu'alors absents, ou l'émergence
d'un nouveau type sérologique dominant. La présence des Escherichia coli dans le milieu
environnant ou dans les aliments signe une contamination fécale, mais pas obligatoirement
une contamination humaine : tous les animaux à sang chaud abritent Escherichia coli.
Exemple de vecteur
• Topoisomerized vector for 5-minute
TOPO® Cloning of Taq-generated
PCR products
• Enterokinase cleavage site to remove
thioredoxin after protein purification (if
desired)
• C-terminal V5 epitope for detection
and analysis with the Anti-V5
antibodies
• C-terminal 6xHis tag for rapid
purification with ProBond™ resin and
detection with the Anti-His(Cterm)
antibodies
Souches de Escherichia coli
Souches
But
recherché
BL21
Amplification/
Stabilité des
plasmides
Expression
de protéines
souche
DE3
DH5
DH10
TOP10
souche -E
souche
B-T1R
souche F'
DH5αF´IQ™
-
Exemple : souche BL21 DE3 : F ompT hsdSB (rB-, mB-) gal dcm rne131 (DE3)
-
F : pas de gène pour pillus; ompT: déficit en une protéase ; hsdSB (rB-, mB-)
déficit en une endonucléase ; ...
34 –Expression chez la levure :
4 espèces : Saccharomyces cerevisiae
Pichia pastoris
Pichia methanolica
Schizosaccharomyces pombe
Avantages : Culture aisée
Modifications post-traductionnelles
Systèmes d'expression
Génétique maîtrisée
Inconvénients : Modifications post-trad° différente de humaine
Certaines protéines mammifères sont toxiques
Exemples de type cellulaire animale utilisé pour la surexpression de protéines
Cell Line Name
Organism Type
Tissue
COS-7
Primate - Non Human
Kidney
HEK 293
Human
Kidney
Sf9
Insect
Ovary
High 5 (BTI-Tn-5B1-4)
Insect
Embryo
HAS-P
Mouse
Breast/Mammary
RAW 264.7 cells, Murine
Macrophage Cells
in vivo mouse brain
Mouse
Macrophage
Mouse
Bone
Cellules Mammifères
Cellules Mammifères
• Cellules de singes, souris, lapin, ...
• Cellules humaines immortalisées
+ modifications post-traduct ±identique à
homme
- milieu riche avec interleukines et
hormones de croissance  coût +++
- expression peu efficace
Cellules Mammifères
• Cellules humaines non mortalisées
+ cellules saines
+ modifications post-traduct OK
- milieu riche avec interleukines et hormones de
croissance  coût +++
- expression peu efficace
 interaction protéines-protéine in vivo
 réinjection possible = thèrapie génique
 voies de signalisation, effet in vivo
= cellules cancéreuses
+ modifications post-traduct OK
- milieu riche avec interleukines et hormones de
croissance  coût +++
- expression peu efficace
 Expression d'anticorps monoclonaux
 voies de signalisation, effet in vivo
Cellules Mammifères
• Comment transfectées ces cellules ?
1) Utilisation de virus modifié (in vivo / in vitro )
(Vaccine, EBV,...) efficacité OK mais problème :
- d'insertion aléatoire (cf "bébé-bulle")
- persistance de l'expression (mucovicidose)
- réaction immunitaire spécifique (mucovicidose)
2) Electroporation (in vitro uniquement) :
- efficacité faible et mortalité élevée
- persistance expression
+ non immunogène
41 Mutagenèse aléatoire.
Objectifs :
modification du
phénotype,
recherche de la
mutation associée
Moyens :
• irradiations (UV,
RX),
• produits chimiques
• utilisation de
DNApol modifiée
Agents mutagènes
• Irradiations  modification d'une ou
plusieurs bases
• produits chimiques :
• DNApol modifiée, suppression de la
fonction exonucléasique  pas de
correction possible (exple fragment
kleenow, MutaGen™ )
Insuline
Régulation de la
glycémie chez les
mammifères :
Rôle + du glucagon
 relargage par le foie
Rôle – de l'insuline
 Absorption cellulaire
du glucose notamment
par adipocytes
•
Diabète de type I : déficit de production de l'insuline.
• Due à réaction autoimmune :
Ac ilôts de
Langerhans
hyperglycémie
coma
 mort
•
• 10% des diabétiques
• Apparition favorisée
par infection par
certains virus (EBV,...),
traitement médicaux,
chirurgicaux.
Diabète de type II : problème de transduction du signal sur cellules
réceptrices.
• Due à mauvaise
alimentation + terrain
génétique.
hyperglycémie
chronique
problèmes
cardiaques,
visuels,rénaux,
neurologiques, ...
• 90% des diabétiques.
•Chez sujets adultes,
agés
• Apparition
multifactorielle :
génétique, alimentaire,
autoimmune
(Ac  insuline-recepteur),...
Structure de l'insuline
• Formée de 2
chaînes, A et B
• synthétisée sous
forme de
proinsuline
Préproinsuline humaine
peptide signal
peptide B :31 aa
FVNQHLCGSHLVEALYLVCGERGFFYTPKT
D
fSL
peptide C
peptide A : 20 aa
GIVEQCCTSICSLYQLENYCN
L
RREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKR
H
L
Dates importantes de l'histoire de l'insuline
•
•
•
•
•
•
•
•
•
•
•
•
•
1889 : Ablation du pancréas induit un diabète chez le chien.
1908 : Restauration de la glycémie par injection d'extrait de
pancréas chez chien sans pancréas.
1921 : Extraction d'une hormone antidiabétique simultanément par
2 équipes : Bucarest (Paulesco), Toronto (Banting & Macleod).
1922 : premiers patients traités et sauvés à Toronto
1923 : Banting & Macleod : prix Nobel de médecine
1925-1970 : amélioration de la pureté et des formulations (1ère
insuline retard par ajout de Zn, protamine)
1926 :cristallisation de l'insuline
1958 : détermination de la structure chimique de l'insuline (1ère
protéine séquencée): prix Nobel de chimie pour Sanger.
1967 : Séquence de la proinsuline.
1969 : Structure 3D de l'insuline.
197n : "humanisation" de l'insuline porcine.
1982 : production d'insuline recombinante.
1983  Amélioration du procédé
Purification de l'insuline:
A partir de pancréas
• Le pancréas est découpé en morceaux,
• Suspendu dans ethanol à pH 2
(inactivation de la trypsine),
• neutralisation / CaCO3,
• précipitation par sels (KCl, NaCl, SO4(NH4)2, ...),
• resuspension dans eau et précipitation par
acidification
• + chromatographie : Gel filtration et/ou
échangeuse d'ions
Surproduction
d'insuline.
• Production séparée des chaînes
A et B chez E. coli. Les peptides
étaient co-exprimés avec autre
protéine (-gal, TrpE, ...).
• séparation /protéolyse
• 2A +1B sulfoné (cys-SO2) +
mercaptoethanol, 24H
 60 % rendemment.
• purification / chromatographie
phase inverse
Conversion d'insuline porcine.
= remplacement AlaThr
• purification insuline (cf précédent),
• conversion : insuline (porc) + Trypsine +
thréonine ester dans eau+solvant organique
(diminue activité peptidase de trypsine et favorise la réaction inverse),
rendement <97 %
• Purification par chromatographie(s)
Surproduction de proinsuline.
sur expression chez E. coli (1982)
• insertion du cDNA de la préproinsuline dans une
vecteur bactérien.
• surproduction avec protéine de fusion (idem).
• coupure / protéase  proinsuline
• oxydation des cystéines
• repliement de la protéine en présence de
réducteurs.
• coupure par protéase spécifique
• purification par chromatographie
Surproduction de proinsuline.
sur expression chez S. cerevisiae (1988)
• insertion du cDNA de la préproinsuline dans une
vecteur de levure.
• surproduction avec protéine de fusion (idem).
• coupure / protéase  proinsuline insuline
• purification par chromatographies
Masters existants
Ingénierie Structurale et Fonctionnelle des Biomolécules (Paris Sud)
http://www.lebs.cnrs-gif.fr/master/master.html
Structures, Protéome et Génomique Fonctionnelle (Paris 7)
http://www.biochimiep7.jussieu.fr/enseignement/master_spgf.html
MASTER SCIENCES, TECHNOLOGIES et SANTÉ (Grenoble)
http://www.ujf-grenoble.fr/ujf/fr/formation/lmd/livret/Master/domaine-sciences-technologiessante/master-sciences-vivant/M2/M2biostructuralenano.pdf
Master Sciences et Technologies Mention Biologie Santé (Bordeaux)
http://www.ubordeaux1.fr/biologie/formations/master/biochimie_structurale/master_recherche_bioch_struc
t_interface.htm
http://www.ufrsdv.u-bordeaux2.fr/formation/initiale/MRbiochstru.htm
BIOCHIMIE STRUCTURALE ET FONCTIONNELLE (Lyon)
http://biochimie.univ-lyon1.fr/Presentation_Master_Recherche.pdf
Biochimie structurale, bio-informatique et génomique (Marseille)
http://www.univ-aixmarseille.fr/scuio.htm?scuio=34
Téléchargement