STRUCTURE DES PROTIDES : ACIDES AMINES, PEPTIDES, PROTEINES CM Catherine Sarazin L1S2 Biochimie 2016 I. DEFINITION ET CLASSIFICATION Au sein des protides, on distingue 3 classes de composés: Les acides aminés: petites molécules avec au moins une fonction amine et une fonction carboxylique ; Les peptides: molécules formées de l'enchaînement d’au moins deux acides aminés et de MM inférieure à 6000 ~ 8000 dalton ; Les protéines: composés libérant par hydrolyse des acides aminés et de MM supérieure à 6000 ~ 8000 dalton . II. LES ACIDES AMINES A. STRUCTURE 1. Définition Comme son nom l'indique, un acide aminé possède à la fois un groupe carboxyle (-COOH) et un groupe amine (en général, amine primaire C-NH2, sauf pour la proline qui a une amine secondaire). Compte-tenu des pKa d’ionisation de la fonction carboxylique (acide) et de la fonction amine (basique), à pH 7, le carboxyle sera sous la forme carboxylate (COO-) et la fonction amine sera sous sa forme acide conjuguée, c’est-à-dire protonée. Bien qu’il existe au moins 300 acides aminés dans la nature, il en existe seulement 22 entrant dans la composition des protéines (acides aminés protéinogènes), qui sont tous des acides aminés. Toutefois, ces 22 acides protéinogènes peuvent être présents dans les protéines sous des formes dérivées comme par exemple par méthylation, phosphorylation, acylation, acétylation etc. Ces dérivés proviennent de modifications post-traductionnelles, c’est-à-dire de modifications qui affectent la structure de la protéine après sa synthèse par la machinerie cellulaire de traduction par un ARNm. Ces 22 acides aminés peuvent être classés selon leurs propriétés physico-chimiques telles que leur caractère hydrophile ou hydrophobe par exemple. 2. Les classes des acides aminés Les structures ci-dessous ne tiennent pas compte de l'ionisation des différentes fonctions. 2-a. Chaîne latérale hydrohopbe (non polaire) alanine (ala, A) valine (val, V) leucine (leu, L) isoleucine (ile, I) pHi = 6.02 pHi = 5.97 pHi = 5.98 pHi = 6.02 MM = 89 g.mol -1 proline (pro, P) MM = 117 g.mol -1 phénylalanine MM = 131 g.mol -1 tryptophane (trp, W) MM = 131 g.mol-1 méthionine (met, M) (phe, F) pHi = 6.3 MM = 115 g.mol pHi = 5.48 -1 MM = 165 g.mol pHi = 5.88 -1 MM = 204 g.mol pHi = 5.75 -1 MM = 149 g.mol-1 Alanine (C3) C'est l'acide aminé le plus simple qui possède un carbone asymétrique. Sa chaîne latérale aliphatique est composée d’un méthyle (CH3). Il est présent dans toutes les protéines. Valine (C5), leucine (C6) et isoleucine (C6) Leur chaîne latérale aliphatique est ramifiée. Comme dans le cas de l'alanine, ces trois acides aminés jouent un rôle important dans la formation et le maintien de la structure tridimensionnelle des protéines car ils ont une tendance naturelle à se confiner dans les espaces dépourvus d'eau. Proline (C5) C'est une structure particulière car la chaîne latérale hétérocyclique de cet acide aminé est liée au C mais également à l'azote du groupe aminé. Le cycle formé par la chaîne latérale porte le nom de noyau pyrrolidine. La proline est un acide iminé car il contient une fonction amine secondaire (-NH-) alors que les autres acides aminés ont tous une fonction amine primaire (-NH2). Cet acide aminé est donc une exception à la formule générale. La forme cyclique de la proline peut entraîner des contraintes dans la géométrie du squelette polypeptidique qui la contient, créant parfois de brusques changements de direction dans la conformation de la protéine. Phénylalanine (C9) et tryptophane (C11) Ces deux acides aminés possèdent une chaîne latérale aromatique. La phénylalanine est constituée d'un radical phényle qui substitue un hydrogène de l'alanine. Le tryptophane possède deux hétérocycles formant le noyau indole (hétérocycle formé d’un noyau aromatique et d’un noyau pyrrole). On trouve ces acides aminés dans le cœur hydrophobe des protéines. Méthionine (C5) Cet acide aminé possède un atome de soufre dans sa chaîne latérale. La chaîne latérale de la méthionine possède un groupe méthylthioéther. C'est un acide aminé peu abondant dans les protéines mais qui intervient dans de nombreuses synthèses biochimiques comme donneur de groupement méthyle. 2-b. Chaîne latérale hydrophile et neutre (polaire) glycine (gly, G) sérine (ser, S) thréonine cystéine (cys, C) (T, thr) pHi = 5.97 MM = 75 g.mol pHi = 5.68 -1 asparagine MM = 105 g.mol pHi = 6.53 -1 MM = 119 g.mol pH i= 5.02 -1 MM = 121 g.mol-1 glutamine (glu, Q) tyrosine (tyr, Y) pH = 5.41 pH = 5.65 pH = 5.65 MM = 75 g.mol-1 MM = 105 g.mol-1 MM = 181 g.mol-1 (asn, N) Glycine (C2) C'est le plus simple des acides aminés car R = H. C’est le seul acide aminé qui ne possède pas de carbone asymétrique. Son ancien nom de glycocolle (qui veut dire sucre de colle) provient de son goût sucré et du fait qu'il a été isolé la première fois à partir d'un hydrolysat de gélatine. Cet acide aminé est présent dans toutes les protéines et est abondant dans certaines d'entre elles comme par exemple la fibroïne de la soie qui en contient 40%. Il joue un rôle important dans la conformation de la protéine, sa faible taille lui permettant de se placer là où d'autres acides aminés sont exclus. Sérine et thréonine Ces deux acides aminés possèdent une fonction alcool (alcool primaire pour la sérine et secondaire pour la thréonine). Ces alcools peuvent être estérifiés par l’acide phosphorique pour former la phosphosérine et la phosphothréonine qui jouent un rôle important dans la régulation de l’activité des protéines. On retrouve ces acides aminés au niveau du site catalytique de certaines enzymes. Ils servent également de liaison avec les glucides pour former les glycoprotéines. Cystéine (C3) La chaîne latérale de la cystéine possède un groupement thiol (-SH) qui joue un rôle important dans la structure de certaines protéines. Le groupement thiol peut former des liaisons hydrogène avec l’oxygène et l’azote. Il permet aussi d'établir une jonction entre des régions d'une même chaîne polypeptidique ou en reliant deux chaînes polypeptidiques par oxydation. L’oxydation de deux cystéines conduit en effet à la formation d’un pont disulfure qui stabilise la structure dans l’espace de certaines protéines Asparagine (C4) et glutamine (C5) La chaîne latérale de l’asparagine porte une fonction amide en C. Bien que non chargée, cette chaîne latérale est fortement polaire. Le groupe amide peut former des liaisons hydrogène avec les atomes des chaînes latérales d’autres acides aminés polaires. La glutamine présente les mêmes caractéristiques que l’asparagine mais avec une chaîne carbonée présentant un carbone de plus. Elle joue un rôle essentiel dans le transport et la mise en réserve de l'azote aminé avec passage possible à l'ammoniaque Tyrosine (C9) Cet acide aminé provient de la substitution de l'hydrogène en para de la phénylalanine par un groupe hydroxyle (polaire). L'hydroxyle de la tyrosine intervient dans le mécanisme catalytique de certaines enzymes. Il est également à l'origine de composés biochimiques importants tels que les hormones thyroïdiennes mais également des neurotransmetteurs tels que l'adrénaline. Deux acides aminés polaires ont été identifiés plus récemment comme étant des AA standards (protéinogènes mais beaucoup plus rares), Pyrrolysine (Pyl, O) MM = 255 g.mol -1 Sélénocystéine (Sec, U) MM = 168 g.mol-1 (pKa R = 5,2) 2-c. Chaîne latérale hydrophile et basique histidine (his, H) lysine (lys, K) arginine (arg, R) pH = 7.59 pH = 9.74 pH = 10.76 MM = 155 g.mol-1 MM = 146 g.mol-1 MM = 174 g.mol-1 Ces trois acides aminés basiques possèdent au moins un atome d'azote et six atomes de carbone. C'est pourquoi ils portaient anciennement le nom de " bases hexoniques ". La chaîne latérale de l’histidine comporte un noyau imidazole. Ce groupe imidazole est ionisable et sa forme protonée porte le nom d’ion imidazolium : La chaîne latérale de la lysine porte une amine primaire et est une base forte. A pH 7, l'espèce ionique majeure est l'ion ammonium (-NH3+), conférant ainsi une charge positive. Rappel : Les carbones de la chaîne latérale sont différenciés par des lettres grecques : le carbone adjacent au carboxyle est désigné carbone , et les autres dans l'ordre, , , , , etc. C'est pourquoi on parle de groupe -aminé terminal de la lysine. L'arginine est le plus basique de ces trois acides aminés. A pH 7, son groupe guanidine est sous forme d'ion guanidium : 2-d. Chaîne latérale hydrophile et acide acide aspartique acide glutamique (asp, D) (glu, E) pH = 2.98 MM = 133 g.mol pH = 3.22 -1 MM = 147 g.mol-1 Ces deux acides aminés contiennent un groupe carboxyle sur leur chaîne latérale : - Aspartate : groupe -carboxyle ; - Glutamate : groupe -carboxyle. A pH 7, ils sont sous forme carboxylate et confèrent aux protéines une charge négative exposée à leur surface. C'est pourquoi on les nomme aspartate et glutamate et non les formes acides correspondantes, acide aspartique et acide glutamique. Ces deux acides aminés jouent un rôle important dans le métabolisme. On pourrait également proposer une classification regroupant les acides aminés aromatiques (Phe, Trp, Tyr), ou regroupant ensembles tous les acides aminés à chaine latérale ionisable dans l’ordre croissant du pKa de la chaine latérale (Asp, Glu, Sel, His, Cys, Tyr, Lys et Arg) Remarque : Parmi ces 22 AA nécessaires à la synthèse des protéines, 10 ne peuvent être synthétisés in vivo par les Mammifères en quantité suffisante pour couvrir leur besoin. Ces 10 AA sont dits « indispensables » et doivent être apportés par l’alimentation. Acides aminés Acides aminés non indispensables indispensables Ile Ala Leu Asp Lys Asn Met Cys Phe Glu Thr Gln Trp Gly Val Pro Arg* Ser His* Tyr Les acides aminés indispensables et non indispensables pour l'homme adulte * Ces AA sont dits « semi-indispensables » car ils peuvent être synthétisés mais à un taux insuffisant pour le soutien de la croissance des jeunes ? B. PROPRIETES GENERALES 1. Propriétés physiques 1a. Solubilité La solubilité des acides aminés dans l’eau est en rapport avec leur structure et dépend de plusieurs facteurs : la nature de la chaîne latérale R, le pH de la solution, la nature et la concentration des ions éventuellement présents en solution. La solubilité des acides aminés dans les solvants organiques est faible et très variée. Elle est mise à profit dans des techniques séparatives comme la CCM. 1b. Pouvoir rotatoire Toute molécule chirale possède la particularité d'être "optiquement active", c'est à dire que lorsqu'elle est traversée par un faisceau de lumière polarisée, elle provoque une rotation du plan de polarisation (plan de vibration) de cette lumière. Ainsi, à chacun des 21 acides aminés possédant un carbone asymétrique correspond 2 isomères optiques ayant un pouvoir rotatoire de signe opposé: l'un fait tourner le plan de polarisation de la lumière dans le sens inverse des aiguilles d'une montre, il est dit lévogyre ou (-) ou l; l'autre fait tourner le plan de polarisation de la lumière dans le sens inverse, il est dit dextrogyre ou (+) ou d. Le C, lié au -NH2 et -COOH, est chiral ou asymétrique (sauf pour la glycine où R = H), car il porte 4 substituants différents. Les 21 acides aminés possédant un C asymétrique peuvent exister sous forme de stéréoisomères, c'est-à-dire sous forme de composés de formule moléculaire identique mais différant par l'arrangement spatial de leurs atomes, autrement dit par leur configuration. Pour chaque acide aminé chiral, il existe 2 énantiomères, c'est-à-dire 2 stéréoisomères qui sont l'image l'un de l'autre dans un miroir (rappel: les stéréoisomères qui ne sont pas énantiomères sont des diastéréoisomères). Par convention, chaque énantiomère d'acide aminé est identifié selon son type de configuration D ou L, en faisant référence au glycéraldéhyde : L-alanine D-alanine Les protéines ne renferment que des acides aminés qui ont une configuration spatiale comparable à celle du L-glycéraldéhyde (qui sert de modèle de référence historique). Ce sont donc tous des acides L--aminés. On doit à Pauling et Corey (prix Nobel, années 50) d'avoir démontré que les acides aminés constitutifs des peptides et des protéines sont tous de forme L. Remarque 1 : on peut rencontrer des acides aminés de configuration D dans la nature, par exemple dans les parois bactériennes et dans certains polypeptides bactériens à activité antibiotique. Remarque 2: le fait d'être D ne signifie pas que l'acide aminé est dextrogyre. De même, un acide aminé L n'est pas forcément lévogyre. Ainsi, les acides aminés contenus dans les protéines sont tous L mais certains sont lévogyres et d'autres dextrogyres. 1c. Propriétés d’absorption dans l’ultraviolet Les acides aminés présentent une absorption importante à une longueur d’onde inférieure à 230 nm et certains absorbent entre 250 et 300 nm (UV). C’est le cas de la Phe, de la Tyr et du Trp. Leur propriété d’absorption UV et liée à la présence de double liaisons conjuguées au niveau de leur chaîne latérale. A pH neutre, la Tyr et le Trp absorbent à 280 nm et la Phe absorbe plutôt à 260 nm. La mesure de l'absorbance à 280 nm est un moyen de quantifier ces acides aminés et par conséquence également un moyen de doser les protéines, via la loi de Beer-Lambert. D’après Wetlaufer, D.B., 1962. Ultraviolet spectra of proteins and amino acids. Advances in Protein Chemistry 17:303–390 2. Ionisation en solution L’ionisation est une propriété essentielle car elle conditionne le comportement des acides aminés et par conséquent celui des protéines en solution aqueuse, selon le pH du milieu. Les acides aminés sont des composés amphotères : capables de céder ou d’accepter des protons, pouvant ainsi se comporter comme une base ou comme un acide en fonction du pH du milieu. On verra le cas des acides aminés présentant une chaîne latérale ionisable en TD. 2a. Cas des acides aminés à R non ionisable Les acides aminés à une seule fonction acide et une seule fonction basique sont ceux du groupe des R hydrophobes et des R hydrophiles neutres (à l'exception de la cystéine et de la tyrosine). On a deux dissociations possibles et l’acide aminé peut se trouver sous trois formes différentes en fonction du pH de la solution. Les deux pKa déterminent 5 zones dans l’échelle des pH, caractérisées par la prédominance de l’une ou de l’autre des trois formes possibles : zmitterion Cation 0 pK1 pI Anion pK2 pH Cation 50% Zmitterion 50% Zmitterion 100% Anion 50% Zmitterion 50% Au pK1, pK de dissociation du groupe carboxyle, on a 50% de la forme anion et 50% de la forme zwitterion. Au pK2, pK de dissociation du groupe aminé, on a 50% de la forme zwitterion et 50% de la forme cation. Il existe une zone de pH pour laquelle l’acide aminé se trouve essentiellement sous forme de zwitterion. Cette zone de pH est appelée zone isoélectrique (plus de 99% de la forme zwitterion) : elle est comprise entre le pK1 + 2 et le pK2 – 2. 3HN + __ CH (R) __ COO- NH2 R anion charge électrique -1 R CH A COOH NH3+ NH2 CH A- R cation charge électrique +1 CH COO- COOH NH3+ R A± CH COOion mixte dipolaire ou "zwitterion" électriquement neutre Les différentes formes ionisées des acides aminés à chaîne latérale non ionisable En raison de la proximité de la fonction carboxylique et de la fonction amine (portées par le même carbone, le carbone ), ces fonctions sont plus acides que leur homologues en bout de chaine aliphatique. Ainsi, le pKa de COOH est de l’ordre de 2, et le pKa NH2 de l’ordre de 9 2b. Cas des acides aminés à R ionisable Les acides aminés dicarboxyliques peuvent subir trois dissociations successives. Ils sont qualifiés d’acides aminés acides. Les acides diaminés peuvent aussi subir trois dissociations successives. Ils sont qualifiés d’acides aminés basiques. (cf TD) exemple de dissociation de l'acide glutamique A+ http://biochimej.univangers.fr/Page2/TexteTD/7ModuleS6BG3/ZSuite/5HenderHassel/1HenderHassel.htm Exemple de courbe de titration : l'histidine Les pKaR des chaines latérales sont données dans le poly de TD III. LES PEPTIDES On distingue, selon le nombre de résidus d'acides aminés, les oligopeptides (qui contiennent de 2 à 5 acides aminés) et les polypeptides (de 6 à plusieurs dizaines d’acides aminés). 1. Structure 1a. La liaison peptidique La liaison peptidique est une liaison covalente formée par une réaction de condensation avec l'élimination d'une molécule d'eau entre le groupement -carboxylique d'un acide aminé et le groupement -aminé d'un autre acide aminé (réaction de condensation). La liaison peptidique est une liaison amide particulière. Le groupement -aminé de l'acide aminé 2 agit comme un nucléophile pour déplacer le groupement hydroxyle de l'acide aminé 1: H2N __ CH (R1) __ COOH + H2N __ CH (R1) __ COOH + H2 0 Formation de la liaison peptidique exemple La liaison peptidique présente un caractère partiel de double liaison. En effet, dans la liaison peptidique, deux doublets d'électrons sont situés à proximité : les électrons du carbone carbonyle et les électrons disponibles de l'atome d'azote. Leur résonance donne au groupe peptidique une structure intermédiaire entre deux formes limites mésomères ainsi, la liaison peptidique est intermédiaire entre une liaison simple et une liaison double. On estime à 40% son caractère double. Formes limites (mésomères) de la liaison peptidique Il en résulte que le groupe peptidique est une structure rigide dans une géométrie plane : 6 atomes (les deux atomes de la liaison et les 4 atomes adjacents) se trouvent dans un même plan. Les deux C se placent de part et d'autre du pont C-N, le plus souvent dans la configuration trans, en tenant compte des contraintes stériques. La configuration trans est en effet la plus favorable sur le plan thermodynamique. La Proline est une exception: environ 10% des résidus Proline sont en configuration cis. En effet, en raison de sa structure circulaire impliquant une amine secondaire, la configuration cis n'entraîne pas beaucoup plus d'interférence stérique que la configuration trans. Les Prolines, en configuration cis, introduisent des courbure ou coudes dans la structure des peptides et des protéines. Il faut noter que de part et d'autre de ce motif rigide, les rotations des groupes autour des liaisons C-N () et C-C () sont libres et seulement limitées par des contraintes stériques qui déterminent la structure tridimensionnelle des protéines. 1b. Les ponts disulfures Un peptide peut comporter une ou plusieurs chaines peptidiques. Ces chaines sont généralement liées par un pont disulfure, c’est-à-dire une liaison covalente entre deux cystéines. Cette liaison résulte de l’oxydation des groupements SH de deux cystéines (forme réduite) et donne lieu à la forme oxydée S-S appelée cystine. 2. Nomenclature Exemple d'un tétrapeptide : glutamyle-glycyle-alanyle-lysyne. Par convention, le résidu AA dont la fonction amine reste libre est écrit à gauche, et celui dont la fonction carboxylique reste libre est écrit à droite. Le résidu AA dont la fonction amine est libre est appelé N-ter (à gauche), le résidu AA dont la fonction carboxylique est libre est appelé C-ter. Ainsi, le dipeptide glycylalanine est différent du dispeptide alanylglycine Les résidus AA porte un suffixe « yle » sauf le C-ter qui garde son nom d’aminoacide. Rq : des peptides peuvent résulter de la condensation entre des fonctions amines ou carboxyliques des chaines latérales (et non les fonctions dans ce cas, on parle de peptidoïdes ou de liaison peptidoïque. 2. DETERMINATION DE LA STRUCTURE DES PEPTIDES Au préalable, les ponts disulfures doivent être rompus et les cystéines protégées pour qu’ils ne se reforment pas 2a - Détermination de la composition en acides aminés = séquence primaire Hydrolyse des liaisons peptidiques afin de libérer les acides aminés. L'hydrolyse est réalisée en présence d'HCl 6 M à 110°C, sous vide et pendant 16 à 72 h. Certains acides aminés peuvent être détruit (Asn en Asp et la Gln en Glu; Trp). Analyse des acides aminés par chromatographie de partage sous forme de dérivés PTC ou par chromatographie d’échange d’ions. 2b - Détermination de la séquence peptidique Réactifs agissant côté -NH2 terminal : identification du résidu N-terminal Méthode de Sanger : L’arylation par le fluoro-2,4-dinitrobenzène (FDNB ou réactif de Sanger) donnant un dérivé DiNitroPhényle avec l’AA N-terminal (DNP-AA1) Méthode historique Réaction d’acylation par le 1-diméthyl-amino-naphtalène-5-sulfonyle (DNS Cl ou chlorure de DANSyle. Donnant un dérivé DNS-AA1. Plus sensible que la précédente (x 100). Le problème de ce type de dérivations (avec le FDNB ou le DNS Cl) est que seul l’acide aminé N-terminal est identifié. En effet, après dérivation du peptide par son extrémité Nterminale, on procède à son hydrolyse totale. Méthode récurrente d'Edman : Elle permet de détacher l’acide aminé N-terminal sans avoir à hydrolyser le reste de la chaîne 1. Traitement par le phénylisothiocyanate (PITC) du peptide à n résidus : à pH 9, le PITC réagit avec le -NH2 terminal du peptide pour donner un dérivé phénylthiocarbamyle (PITC-peptide) ; 2. Traitement par l'acide trifluoroacétique : en milieu acide doux, le dérivé PITC-peptide est cyclisé en dérivé PTH (phénylthiohydantoïne) qui se détache en laissant la chaîne raccourcie d’un résidu ; 3. Extraction du dérivé PTH-aa par un solvant organique : lors de l'extraction du dérivé par un solvant organique, le peptide à (n-1) résidus reste dans la phase aqueuse. 4. Analyse par chromatographie du dérivé PTH-aa . Des séquenceurs automatiques permettent l’analyse des séquences de peptides contenant jusqu’à 50 acides aminés. Quelques pmoles de peptide suffisent pour en déterminer la séquence. Réactifs agissant côté -COOH terminal Traitement du peptide par de l’hydrazine anhydre, 2HN-NH2, (12 h à 100°C) : hydrolyse des liaisons peptidiques et formation d’hydrazides d’acides aminés. Seule la fonction carboxyle de l’acide aminé C-terminal n’est pas attaquée. En effet, en solution dans l’hydrazine, les fonctions acides libres se trouvent sous forme d’ions carboxylates qui résistent à une addition nucléophile. Le résidu C-terminal est ainsi libéré sous forme d’acide aminé libre et peut être identifié par chromatographie. Utilisation d'enzyme : décarboxylase Méthodes enzymatiques On fait appel à des peptidases : Exopeptidases: peptidases qui hydrolysent la chaîne à l’extrémité C-terminale du peptide (carboxypeptidases) ou à l’extrémité N-terminale (aminopeptidases) Endopeptidases : peptidases qui hydrolysent les liaisons peptidiques internes. Ces enzymes sont en général très spécifiques de l’acide aminé mais également du côté de coupure : coupure du côté du carbonyle ou du côté de l’amine de la liaison peptidique. : H H O H H O H H O H H O H H O H H O N C C N C C N C C N C C N C C N C C R Val Leu Ile THERMO -LYSINE R Phe Tyr (Trp) PEPSINE R Asp Glu R R Arg Lys R Phe Tyr Trp (Leu) (Ile) PROTEASE STAPHYLOCOCCIQUE Spécificité des endopeptidases CHYMOTRYPSINE TRYPSIE PAPAINE Méthodes chimiques spécifiques Le clivage spécifique des peptides peut se faire par des méthodes chimiques. Nous ne verrons que les plus utilisées. Action de l’hydroxylamine (NH2OH) : L’hydroxylamine coupe la chaîne peptidique entre l’arginine et la lysine. COO- Action de l’iodobenzoate : I Il coupe la chaîne peptidique du côté carboxylique des résidus de Trp. Action du bromure de cyanogène : Le bromure de cyanogène coupe la chaîne peptidique du coté carboxylique des résidus méthionine en réagissant avec l’atome de soufre du groupement thioéther. Cette réaction complexe passe par un intermédiaire cyclique. Coupure d'une chaîne peptidique par le bromure de cyanogène au niveau de la méthionine Coupure des ponts disulfures Les méthodes de séquençage que nous venons de voir ne s’appliquent qu’aux peptides sous forme d’enchaînements linéaires d’acides aminés. Il est donc nécessaire de rompre les ponts disulfures intra- ou interchaînes préalablement au séquençage. Cette rupture doit aussi éviter leur reconstitution. On utilise deux méthodes pour couper les ponts disulfures Oxydation par l’acide performique. Certains acides aminés, dont le Trp, peuvent être altérés ; Réduction par un thiol suivie d’une alkylation . Le -mercaptoéthanol est le plus utilisé. On peut aussi utiliser du dithiothréitol. L’alkylation permet d’éviter la reconstitution des ponts disulfures. Elle produit des dérivés S-carboxyméthylés stables. 3. QUELQUES EXEMPLE DE PEPTIDES A ACTIVITE BIOLOGIQUE L'insuline L'insuline, hormone pancréatique, contient 2 chaînes polypeptidiques, l'une de 30 acides aminés et l'autre de 21 acides aminés reliées par 2 ponts disulfures (MM = 6 000). L'insuline est sécrétée par les cellules du pancréas en réponse à une augmentation de la glycémie. Cette hormone induit au niveau des organes un accroissement du captage, du stockage et de l'utilisation du glucose sanguin. Le glucagon Le glucagon est une autre hormone pancréatique constituée de 29 acides aminés (MM = 3 500), est une hormone pancréatique sécrétée par les cellules du pancréas quand le taux de glucose sanguin est trop bas. Ses effets s'opposent à ceux de l'insuline. Les Enkephalines Les enképhalines sont des peptides formés dans le système nerveux central qui induisent sur certaines cellules cérébrales une analgésie Certains antibiotiques sont des polypeptides provenant de champignons. Ils contiennent non seulement des acides L-aminés mais aussi des acides D-aminés. La tyrocidine, la gramicidine (cyclique), la pénicilline (Val-Cys-acide organique) en sont des exemples. L'aspartame, est un dipeptide synthétisé et commercialisé, le L-aspartylphénylalanyl méthylester. Il s'agit d'un édulcorant artificiel, à haut pouvoir sucrant. Le glutathion est un tripeptide de formule -glutamylcystéylglycine. Il se caractérise par une liaison non pas -peptidique mais -peptidique entre la Glu (C) et la Cys. Cette liaison n’étant pas une liaison peptidique telle que donnée par la définition, elle porte le nom de liaison peptidoïde. Le glutathion est une molécule réduite qui permet l'élimination des molécules oxydantes et toxiques de la cellule (radicaux libres, H2O2, etc.). IV. LES PROTEINES A. DEFINITION Les protéines sont des macromolécules composées d'acides aminés liés par liaisons peptidiques. De masse molaire supérieure à 6 000 da, on peut les considérer comme de gros peptides. Parmi les protéines, on distingue: Les holoprotéines qui libèrent uniquement des acides aminés par hydrolyse ; Les hétéroprotéines qui libèrent par hydrolyse non seulement des acides aminés mais aussi un autre (ou plusieurs autres) composé(s). Selon la nature de cet autre composé, on distingue : Composé non protéique Hétéroprotéine Exemple Pigment coloré Chromoprotéine hémoglobine Métal Métalloprotéine alcool deshydrogénase H3PO4 Phosphoprotéine caséine Acide nucléique Nucléoprotéine ribosome Lipide Lipoprotéine lipoprotéine plasmatique Glucide Glycoprotéine la plupart des protéines plasmatiques Tableau. Les hétéroprotéines Une autre distinction porte sur la forme des protéines : - les protéines fibreuses ont une forme allongée et forment des associations mécaniquement résistantes et insolubles. Elles constituent la charpente des cellules et des organismes (rôle statique). Citons la kératine (phanères) et le collagène (tendons, peau, os). les protéines globulaires ont une forme grossièrement sphérique. La chaîne polypeptidique se trouve repliée, enroulée de manière compacte. Les replis et les fentes de la structure sont souvent des lieux d'interaction avec d'autres molécules. Elles ont un rôle dynamique parce qu'elles fixent des molécules particulières de manière transitoire. Citons, parmi les protéines globulaires, les enzymes. Les protéines remplissent une très large gamme de fonctions. Citons: Rôle catalytique (enzymes): presque toutes les réactions chimiques du monde vivant dépendent des enzymes (on en connaît plusieurs milliers). Rôle de transporteur, comme, par exemple, l'hémoglobine qui fixe et transporte l'oxygène, ou les lipoprotéines qui transportent les lipides dans le sang. Rôle structural: des protéines sont le support des structures biologiques, comme, par exemple, le collagène, protéine fibreuse qui est le constituant principal des tendons et des cartilages, ou la kératine des phanères (cheveux, poils, ongles). Rôle mécanique: des associations de protéines donnent aux cellules et organismes la capacité de se contracter, de modifier leur forme. Ces protéines sont à l'origine du travail mécanique. C’est le cas de l'actine et de la myosine mises en jeu dans la contraction musculaire. Rôle régulateur de l'activité cellulaire et physiologique: il s'agit par exemple des hormones, de leur récepteur, des protéines qui transmettent la réponse intracellulaire après fixation des hormones à leur récepteur, etc. Rôle de défense comme par exemple les anticorps (ou immunoglobulines) formés par les lymphocytes B du système immunitaire, la thrombine et le fibrinogène qui sont des acteurs de la coagulation sanguine en cas de lésions du système vasculaire, etc. B. STRUCTURE On peut décrire une protéine par une hiérarchie comptant, selon la complexité de la protéine, de 1 à 4 niveaux de structure. Le premier niveau de structure correspond à la séquence des acides aminés. Elle est déterminée génétiquement. Des arrangements de ces structures primaires dans l'espace vont aboutir aux structures secondaires, tertiaires voire quaternaires pour les protéines oligomériques. En effet, les protéines ont des structures tridimensionnelles bien définies. Une chaîne polypeptidique étirée ou disposée au hasard est dépourvue d'activité biologique. La fonction de la protéine dépend de sa conformation, ce qui correspond à l'arrangement des atomes de la structure dans l'espace. 1. Structure primaire Définition: La structure primaire d'une protéine est l'ordre dans lequel les acides aminés sont reliés par covalence pour former une chaîne polypeptidique. La structure primaire apporte donc les informations suivantes: nombre et séquence (ordre d'enchaînement) des résidus d’acides aminés de la protéine. Elle donne aussi le nombre et la position des ponts disulfures. Notons que la structure primaire d'une protéine est un caractère génétique puisque la séquence peptidique dépend de la séquence nucléique du gène qui code pour cette protéine. Ainsi, les anomalies de la structure primaire d'une protéine sont transmissibles aux générations suivantes (caractère héréditaire des maladies génétiques). 2. Structure secondaire La mise en évidence de la structure secondaire des protéines est due à Pauling et Corey qui, à la fin des années 30, entreprirent des études cristallographiques par diffraction des rayons X de la structure des protéines. Ces travaux permirent de mettre en évidence des éléments (ou motifs) structuraux de conformation répétitive et présents de manière récurrente dans les protéines. Le caractère de double liaison partielle de la liaison peptidique limitant les conformations possibles d'une chaîne polypeptidique, il existe seulement un petit nombre de structures secondaires. Parmi les quelques repliements possibles, deux types de repliements sont particulièrement courants car ils résultent d'interactions régulières par liaison hydrogène entre les liaisons peptidiques elles-mêmes, et non pas entre les chaînes latérales des acides aminés de la chaîne polypeptidique. Ils ont été correctement prédits en 1951 à partir de constructions de modèles basées sur les diagrammes de diffraction des rayons X de la soie et des cheveux. Ces deux types de repliements sont L'hélice que l'on trouve dans l' -kératine, protéine de la peau et des phanères, et le feuillet adopté par la fibroïne, protéine de la soie. a. L’hélice Définition: C'est une hélice de pas droit stabilisée par des liaisons hydrogène intracaténaires (hélice de pas droit = le tire-bouchon). Dans l'hélice , chaque O carbonyle est en liaison hydrogène avec l'H de l'amide appartenant au 4ème résidu en aval du coté Cterminal. De telles liaisons hydrogène sont favorisées par la polarisation du groupe peptidique. La terminologie hélice n'est basée que sur une classification ancienne, antérieure à la détermination de la structure. L'hélice est très quasiment toujours une hélice droite (qui fait tourner dans le sens des aiguilles d'une montre quand on progresse le long de la chaîne principale, pourvu que l'œil soit toujours du côté dont on s'éloigne). L’hélice forme ainsi un cylindre rigide dans lequel chaque liaison peptidique est reliée de manière régulière par liaison hydrogène à d'autres liaisons peptidiques proches dans la chaîne. Les chaînes latérales se projettent en arrière du sens de progression de l'hélice et vers l'extérieur, créant le minimum d'interférences stériques avec le squelette polypeptidique. C'est la somme des liaisons hydrogène qui donne à l'hélice sa considérable stabilité. Cependant, la nature de la chaîne latérale influence la stabilité de l'hélice, aussi existe-t-il une prédominance de certains acides aminés tels que Ala, Glu, Leu et Met alors que d'autres acides aminés sont quasiment absents des hélices (Pro, Gly, Ser ou Tyr). Caractéristiques: L'hélice possède des dimensions fixes: 3,6 résidus par tour (pas) ; pas de l'hélice = 0,54 nm (distance parcourue par tour mesurée le long de l'axe de l'hélice). L’hélice est symbolisée par une boucle. Elle est schématisée dans les structures protéiques, selon l'axe de vision par : et Hélice feuillet b. Le feuillet Définition: Il est constitué de chaînes polypeptidiques étirées, stabilisées par des liaisons hydrogène reliant les O carbonyle aux H des groupes amide. Ces liaisons unissent soit des chaînes polypeptidiques adjacentes (au moins 2), soit divers segments de la même chaîne. Le module de base est le brin, dont la conformation est très étendue et que l'on peut assimiler à une hélice contenant seulement deux résidus par tour (puisque l'on retrouve la même disposition des résidus tous les deux résidus) et un déplacement de 3,4 A° par résidu. Cette conformation n'est pas stable si elle est isolée, car aucune liaison H n'y apparaît. Elle n'est stable que dans les feuillets , dans lesquels les liaisons H s'établissent entre deux brins différents soit parallèles soit antiparallèles. On dit que les feuillets sont plissés parce que les C sont tour à tour légèrement audessus et en dessous du plan du feuillet . Les liaisons hydrogène sont perpendiculaires à l'axe des chaînes étirées. Les chaînes courent soit de manière parallèle (toutes dans le même sens N vers C-terminal) ou antiparallèle (alternativement dans un sens et dans l'autre). Feuillet antiparallèle Feuillet parallèle Feuillet de 4 brins anti parallèles Feuillet de 4 brins parallèles Les feuillets sont schématisés par des flèches. Certains acides aminés induisent plus favorablement certaines structures secondaires. On trouve par exemple beaucoup plus fréquemment un Glu dans une hélice que dans un feuillet , et inversement, on trouve beaucoup plus fréquemment une valine dans un feuillet quedans une hélice Il est alors possible à partir de la séquence primaire de prédire des éléments de la structure secondaire. 3. Structure tertiaire Définition: La structure tertiaire est la conformation tridimensionnelle de la chaîne polypeptidique dans son ensemble. Elle permet de séparer les protéines en deux groupes : les protéines globulaires (plus ou moins sphériques, ellipsoïdales) et les protéines fibreuses, formant des filaments ou des fibres. Les protéines globulaires ont une structure tertiaire plus compliquée que les protéines fibreuses. En effet, dans les protéines fibreuses, un seul type de structure secondaire prédomine, alors que les protéines globulaires présentent souvent plusieurs types de structures secondaires. La structure tertiaire des protéines globulaires est déterminée par: les structures secondaires présentes ; les coudes, c'est à dire les boucles qui relient les structures secondaires en permettant le reploiement de la chaîne en sa forme globulaire ; les liaisons faibles et les ponts disulfures qui relient des résidus éloignés dans la chaîne. Ces liaisons sont responsables du repliement de la protéine et donc de sa conformation. Bien que les liaisons covalentes soient beaucoup plus puissantes, les interactions faibles prédominent en raison de leur nombre comme forces de stabilisation de la structure protéique. La conformation la plus stable est celle où les résidus hydrophobes sont dissimulés à l'intérieur de la protéine et pour laquelle le nombre de liaisons hydrogène est maximisé. La figure présente un type courant de structure tertiaire, structure formée de l'alternance d' hélices et de feuillets . Cette structure, nommée barrique ou tonneau /, se retrouve dans certaines enzymes, comme la triose phosphate isomérase. La structure tertiaire des protéines 4. Structure quaternaire Définition: La structure quaternaire décrit l'agencement des sous-unités des protéines oligomériques. Elle concerne uniquement les protéines qui renferment au moins 2 ou plusieurs chaînes polypeptidiques unies par des liaisons non covalentes (hydrophobes et ioniques principalement). Chacune des chaînes est appelée sous-unité ou monomère et leur ensemble forme une structure supra-moléculaire qu’on appelle une protéine oligomérique. Interactions impliquées dans la structure des protéines V. QUELQUES EXEMPLES A. D'HOLOPROTEINES 1) Protéines globulaires Les protéines du sérum (ou protéines sériques) : albumine et globulines. La sérumalbumine intervient dans l’équilibre osmotique et dans le transport de nombreuses substances telles que les ions, les acides gras, la bilirubine, des hormones mais également des médicaments, des colorants, etc On trouve aussi des albumines dans le lait (lactalbumine) et dans le blanc d’œuf (ovalbumine). Les immunoglobulines (reconnaissance antigène/anticorps) Les histones 2) Les protéines fibreuses La notion de structure tertiaire perd son sens pour les protéines fibreuses qui sont en fait des associations entre molécules dans un certain état secondaire. Les fibres sont en effet le résultat d'agrégats ordonnés de molécules élémentaires qui sont toutes sous une unique conformation (hélice ou feuillet) et qui n'existent normalement pas isolées. Les points communs des protéines fibreuses sont la périodicité de séquences à l'origine de l'association des molécules, la réticulation et l'exposition des résidus apolaires. Ces points communs expliquent leur forme, leur insolubilité et leurs propriétés mécaniques. L’-kératine : Composant prépondérant de la laine, des cheveux, de la peau et des ongles, la kératine est une protéine fibreuse constituée presque exclusivement d'hélices enroulées l'une sur l’autre et dont la cohésion est maintenue par des interactions hydrophobes et des ponts disulfures. Les deux superhélices se réenroulent l’une sur l’autre en une torsade de superhélices, nommée protofibrille. L’accolement latéral de ces torsades (quatre ou huit) forme des microfibrilles plus ou moins réticulées par des ponts disulfure. Cimentées par une protéines amorphe, elles composent à leur tour des macrofibrilles qui sont empilées et empaquetées en fibres longues et résistantes. Un cheveu est ainsi constitué d’un faisceau de macrofibrilles d’un diamètre moyen de 20 m. On classe les kératines en « dures » (cheveux, ongles, cornes) et « molles » (épiderme). Leur rigidité et leur résistance à la déformation sont dues à la densité des ponts disulfures donc à la richesse en cystéines. La fibroïne de la soie : Cette protéine est formée de feuillets plissés antiparallèles empilés les uns sur les autres et qui s’étendent dans l’axe de la fibre. La cohésion de l'ensemble est assurée par des liaisons hydrophobes entre les feuillets. La structure primaire révèle la répétition d'une séquence d’acides aminés qui distribue des résidus Gly d'un côté du feuillet et Ser et Ala de l'autre. Les feuillets s'empilent faces " Gly " en contact, faces " Ser, Ala " en contact, en une structure en mille-feuilles qui rappelle celle de la cellulose. [Gly - Ala - Gly - Ala - Gly - Ser - Gly - Ala - Ala - Gly - (Ser - Gly - Ala - Gly - Ala - Gly)8] La structure cristalline obtenue est solide, non extensible mais souple. C. EXEMPLES D’HETEROPROTEINES Les hétéroprotéines sont constituées d’acides aminés mais aussi de substances variées groupées en une unité distincte non protidique, appelée groupement prosthétique.La partie protéique d’une hétéroprotéine porte le nom d’apoprotéine. Les hémoglobines : Ce sont les transporteurs d’oxygène des érythrocytes. Les hémoglobines sont constituées d’une partie protéique, la globine et d’une partie non protéique (ou groupement prosthétique), l’hème. La globine est constituée de quatre chaînes polypeptidiques (tétramère) qui sont maintenues ensemble par des interactions non covalentes. Chacune de ces chaînes contient un hème (partie non protéique ou groupement prosthétique) et un seul site de liaison à l’oxygène. Structure de l’hème : le groupement prosthétique des hémoglobines est, du point de vue chimique, une porphine substituée (noyau tétrapyrrolique fermé par quatre ponts méthényle : -CH =). C’est le cas de la protoporphyrine IX dont l’ensemble forme un plan. Les quatre azote de ce noyau forment une structure chélatrice de métaux par coordination : Mn, Co, Mg, etc. On réserve le nom d’hème aux métalloporphyrines à fer. Structure des porphyrines Figure c). Structure de la protoporphyrine IX coordinant le fer ferreux Dans l’hémoglobine fonctionnelle, c’est le fer ferreux qui est fixé (dans le plan du noyau) par quatre liaisons de coordinance. Il reste deux liaisons à établir perpendiculairement à ce plan pour l’hexacoordonner : l’une permet la fixation de la molécule de dioxygène. On parle alors d’oxyhémoglobine. La cinquième liaison de coordination du fer permet de lier l’apoprotéine. C’est le N3 de l’imidazole d’un résidu histidine de la globine qui fournit le doublet d’électrons. Des liaisons faibles interviennent aussi dans cette association : Liaisons ioniques entre les carboxyles des substituants du noyau tétrapyrrolique et des résidus basiques (Arg et Lys) de la globine ; Interactions hydrophobes entre le noyau tétrapyrrolique et la globine. L’apoprotéine de l’hémoglobine A, principale hémoglobine de l’Homme adulte, est constituée de deux chaînes (ou protomères) et de deux chaînes . Chaque protomère d’hémoglobine est pratiquement identique à la myoglobine, hétéroprotéine localisée dans le muscle qui sert de réserve d’oxygène et facilite le transport de l’oxygène dans le muscle. La chaîne polypeptidique est constituée de huit segments de conformation -hélicoïdale droite. Il y a également sept segments non hélicoïdaux, cinq entre les régions hélicoïdales, un à l’extrémité Ct et un à l’extrémité Nt. La région centrale est presque entièrement constituée de résidus apolaires alors que la région externe contient à la fois des résidus polaires et apolaires. Les 4 niveaux de structures de l'hémoglobine. VI. QUELQUES PROPRIETES DES PROTEINES Les protéines partagent avec les peptides un certain nombre de propriétés: elles sont hydrolysables; certaines protéines sont solubles dans l'eau et, dans ce cas, elles sont ionisables. Mais en raison de leur complexité structurale, les protéines peuvent être dénaturées, c'est à dire perdre leur structure sous l'effet d'agents dénaturants. 1. Hydrolyse et séquençage Les liaisons peptidiques des protéines sont rompues par hydrolyse (enzymatique ou chimique), comme celles des peptides. Les mêmes méthodes que celles présentées pour les peptides sont utilisées pour déterminer la structure primaire des protéines et la stratégie de séquençage est résumée ci-dessous 1- Si la protéine contient plus d’une chaîne polypeptidique, les chaînes sont séparées avant le séquençage 2- Les ponts disulfure (S-S) entre les résidus cystéine d’une même chaîne polypeptidique sont rompus (réduction S-S en SH , SH par action du 2-mercaptoéthanol, de l’acide iodoacétique, ou Oxydation en SO3 par de l’acide performique … ) 3- Détermination de la composition en AA de chaque chaîne (hydrolyse totale des liaisons peptidiques, identification /HPLC) 4- Identification des résidus N- et C- terminaux (méthodes récurrentes d’Edman, carboxypeptidases…) 5- Chaque chaîne polypeptidique est clivée en petits fragments dont on détermine la composition et l’enchaînement (méthodes enzymatiques et chimiques). Cette étape est répétée à l’aide de techniques différentes pour recouper les informations. 6- La séquence globale de la protéine est déduite à partir des séquences des différents fragments. 7- les ponts disulfures sont localisés 2. Ionisation Comme les peptides, les protéines ont des groupements ionisables. Pour chaque protéine, il existe un pH pour lequel la charge moyenne de la molécule est nulle. C'est le pI ou pHi de la protéine. 3. Solubilité dans l’eau Contrairement aux protéines fibreuses, insolubles, les protéines globulaires sont solubles dans l'eau. Les protéines globulaires se caractérisent par un noyau hydrophobe et une surface hydrophile. Leur solubilité dans l'eau dépend: de la concentration en sels, du pH La solubilité d'une protéine est minimale pour pH = pI. 4. Dénaturation Une protéine peut être dénaturée c'est-à-dire qu'elle peut perdre sa conformation native (naturelle et active) et, par conséquence, perdre son activité biologique. Le passage d'une conformation native à une conformation dénaturée et inactive est réalisé par des agents physiques ou chimiques dénaturants. Parmi les agents dénaturants, citons la chaleur (perturbation des liaisons de faible énergie), les acides ou bases fortes (perturbations des liaisons ioniques jusqu’à la rupture de liaisons covalentes), les détergents (perturbations des liaisons hydrophobes) Exemple de dénaturation thermique d'une ribonucléase. Conséquence pratique: on manipule les protéines à froid (0 à 5°C).