Etude des peptides et des protéines par spectrométrie de masse

32
Introduction: intérêt de la spectrométrie de masse pour l'étude des protéines
Les deux origines de la connaissance des séquences de protéines et de peptides sont le séquençage du
génome, d'une part, le séquençage de la protéine d'autre part (méthode d'Edman sur microséquenceurs
automatiques). La première approche est indirecte et prédictive alors que la seconde est basée sur la
dérivation chimique (dérivés phénylthiohydantoïnes ou PTH de la fonction amine terminale) et le
comportement chromatographique des acides aminés individuels. La spectrométrie de masse, à la
différence de ces deux méthodes, est un outil d'analyse directe du composé. Le séquençage des acides
aminés par la méthode d'Edman bute sur un certain nombre d'écueils: blocage éventuel du groupement
amine-terminal, chaîne peptidique branchée, un acide aminé modifié non reconnu ou identifié à tort à
un acide aminé classique, etc… Le séquençage d'Edman est également inapproprié aux peptides
cycliques.
Le séquençage du génome ne permet d'attribuer au peptide qu'une structure probable par traduction
des codons en acides aminés correspondant. Il ne tient donc pas compte des modifications chimiques
post-traductionnelles qui se produisent souvent dans le milieu cellulaire et qui peuvent être nécessaires
à l'activité du peptide ou de la protéine. Il y a donc nécessité de vérifier, par une analyse directe du
peptide l'adéquation de sa structure à celle qui est prévue par le séquençage du génome. Cette
vérification est absolument essentielle dans le cas de protéines recombinantes.
De manière générale, les techniques du génie génétique qui consistent à faire exprimer par une lignée
cellulaire un gène codant pour une protéine issue d'une lignée cellulaire différente exigent que l'on
vérifie l'identité du peptide ou de la protéine issus de cette nouvelle source ou que l'on décèle
d'éventuelles modifications. Dans le cas où les peptides seraient produits en mélange, la MS/MS ou le
couplage chromatographie/SM peuvent être rendus nécessaires. Tout particulièrement lorsque le
composé est destiné à un usage pharmaceutique, l'identification du peptide majoritaire doit se
compléter par celle des dérivés minoritaires (de dégradation par exemple) et éventuellement de leur
dosage. Enfin, dans nombre de cas, l'origine naturelle de ces composés et leur isolement à partir de
matrices biologiques, font en sorte qu'ils ne peuvent souvent être obtenus qu'en faible quantité; il y a
donc nécessité d'une grande sensibilité de la technique d'analyse.
Dans le cas d'une protéine, si l'importance de la masse moléculaire en a fait longtemps des composés
rétifs à l'analyse spectrométrique, aujourd'hui, grâce à l'electrospray ou au MALDI, la mesure de
masse de composés dont le poids moléculaire atteint plusieurs dizaines de milliers de Daltons est du
domaine de la routine, même si la quantité de produit analysé n'excède pas quelques picomoles.
La bonne maîtrise des techniques de couplage LC/MS ou CZE (électrophorèse capillaire)/MS avec une
source electrospray permet d'obtenir simultanément la séparation et l'analyse de mélanges de peptides
ou de protéines dont chaque composant est en quantité picomolaire.
Enfin, le séquençage par MS/MS de peptides se fait désormais en routine; l'apparition d'appareils
magnétiques tandem dotés de détecteurs extrêmement sensibles permet de compléter efficacement le
séquençage d'Edman sur des composés isolés en quantités de plus en plus faibles.
V . 1 Le problème des hautes masses
Quelles sont les informations que l'on peut tirer de la masse moléculaire ?
Ø Dans le cas ou le peptide est inconnu, il s'agit évidemment d'une donnée essentielle
CHAPITRE V ÉTUDE DES PEPTIDES ET DES PROTÉINES PAR SPECTROMÉTRIE DE MASSE
33
Ø Dans le cas où le peptide (ou la protéine) serait connu, cela permet de vérifier la masse
moléculaire par rapport à ce qui était attendu à la suite du séquençage du génome ou de la protéine
selon Edman; il s'agit alors d'une vérification indirecte (car globale) de la séquence peptidique.
Quelques problèmes concrets peuvent ainsi être abordés
Ø Détection de modifications post-traductionnelles d'acides aminés: N-acylations, O-
phosphorylations, sulfatations, O- et N-glycosylations se traduisent par un accroissement,
mesurable et connu, du poids moléculaire.
Ø Formation de ponts disulfure: chaque pont S-S formé se traduit par la perte de deux unités de
masse par rapport à la valeur attendue.
Ø Un remplacement d'acide aminé par un autre se traduit par une modification de la masse
moléculaire, l'emplacement de ce nouvel acide aminé étant déterminé par séquençage MS/MS. Par
ailleurs, les contraintes du code génétique ne rendent possibles qu'un nombre limité d'échanges
d'acides aminés, les mutations étant le plus souvent "simple base".
Ø Perte d'un ou de plusieurs acides aminés: cette modification post-traductionnelle relativement
fréquente (protéolyse) abaisse le poids moléculaire du composé. Deux méthodes sont utilisées
pour la mesure de masse de protéines de grande taille (10 000 Da et plus): l'ionisation par
electrospray et l'ionisation MALDI.
V . 1 . A L'electrospray et la caractérisation de protéines dénaturées ou à l'état natif:
L'utilisation de systèmes solvants comprenant une large part de solvants (alcools, acétonitrile) et
d'acides (formique, acétique, trifluoroacétique) organiques conduit, dans la plupart des cas, à une
dénaturation de la protéine, c'est à dire à une rupture de la plupart des liaisons faibles intra- ou
intermoléculaires. Dans ces conditions, seul reste observable l'enchaînement peptidique.
Si l'échantillon est dissout dans de l'eau tamponnée à un pH proche de la neutralité à l'aide de sels
volatils (acétate ou bicarbonate d'ammonium), certaines interactions faibles survivent au processus
d'évaporation ionique. Ces conditions permettent l'observation de protéines dans un état dit "natif",
c'est à dire dans lequel leurs structures tertiaire (repliée) et quaternaire (protéines multimériques) ainsi
que leurs liaisons avec des cofacteurs métalliques ou organiques sont conservées.
De façon générale, la différence de conditions expérimentales se traduit par des différences spectrales
spectaculaires. Dans des conditions dénaturantes, le spectre electrospray d'une protéine présente
généralement un grand nombre de pics ioniques à relativement basses valeurs de m/z correspondant à
des nombres de charge (z) élevés. En milieu tamponné, le nombre de charge est beaucoup plus réduit,
ce qui déplace les signaux vers de hautes valeurs de m/z (souvent supérieures à 4 000 Th). La large
gamme de m/z des spectromètres magnétique et à temps de vol est donc idéale pour l'observation de
ces pics.
Exemples: Métalloprotéines
Dans le cas des métalloprotéines, la difficulté
analytique est liée à la taille du métal qui est
très petite devant celle de la protéine. La
caractérisation d'un métal se fait en deux
temps. Un premier spectre, enregistré en
milieu dénaturant, permet de caractériser la
partie peptidique de la protéine. Un second
spectre, obtenu en milieu tamponné, permet
de mesurer la masse de la protéine associée
avec son (ou ses) cations(s). La différence de
masse entre celle du complexe et celle de la
protéine seule permet d'identifier le cation
métallique.
MZn
17 654
,
4
M
17 592,3
MZn
(des-Met)
17 523,3 Im
pu
r
eté
Caractérisation de l'atome de zinc d'une
déformylase (déconvolution d'un spectre
ESI
,
conditions natives
)
34
Interactions protéine/protéine: enzymes dimères
La ribonucléotide-réductase de E. coli
contient une sous-unité (R2) qui assure la
liaison de l'enzyme à l'ADN et qui est active
sous forme de dimère. La présence d'un
"cluster" Fe-O-Fe non covalent sur chaque
monomère serait nécessaire à l'activité de cet
enzyme. Le spectre de masse de la protéine,
enregistré dans un tampon bicarbonate
d'ammonium montre des pics ioniques dans
la région m/z 4100-5500 du spectre. La
déconvolution du spectre permet de
déterminer sans ambiguïté la nature
dimérique de l'enzyme et la présence d'un
cluster sur chaque sous-unité (ci-contre).
Protéines tétramériques: le cas de l'hémoglobine
L'une des questions qui se pose systématiquement lorsque l'on
aborde les questions d'interactions non covalentes observées
en electrospray est celle de la spécificité de l'association
macromoléculaire observée. La formation d'agrégats ioniques
(clusters) en phase gazeuse est en effet un processus bien
connu en spectrométrie de masse qui peut être de nature à
porter la suspicion sur la spécificité des complexes
protéine/protéine observés par electrospray. Dans ce contexte,
l'hémoglobine, un hétérotétramère composé de deux types
différents de sous-unités (α: 15 053 Da et β: 15 954 Da) est un
excellent modèle pour évaluer la spécificité de la formation de
complexes protéiques en phase gazeuse. Si, dans des
conditions dénaturantes, la dissociation de l'hémoglobine se
traduit par l'apparition de deux séries de pics correspondant
aux deux sous-unités, en revanche, dans des conditions
douces, la protéine α2β2 est parfaitement caractérisée, chaque
sous-unité étant elle-même liée à une molécule d'hème.
L'absence totale de toute autre forme non spécifique de
complexe protéine/protéine (α1β3 ou α3β1 par exemple) permet
de confirmer la validité de l'analyse par electrospray en termes
de spécificité.
Complexes protéine/ligand organique
La qualité des spectres obtenus à l'aide d'un instrument
magnétique ou à temps de vol dans le cas d'enzymes
multimériques est illustrée parfaitement par l'étude de
protéines associées à leurs cofacteurs métalliques ou
organiques ainsi qu'à leur substrat. L'addition successive de
cofacteurs et de substrats à une protéine peut permettre de
suivre la formation et la stœchiométrie d'entités multimériques
complexes comme la présence de quatre atomes de
magnésium, de deux NADPH et de deux molécules d'un
inhibiteur non covalent sur un enzyme dimère de plus de 115
000 Daltons (isoméroréductase, ci-contre).
Spectre de masse (ESI) de la ribonucléotide réductase
(conditions non-dénaturantes)
M2(Fe-O-Fe)2
Calc. 87 029 Da
Mes. 87 033 Da
Spectre de Masse (ESI) de
l'hémoglobine humaine A0 (T:
tétramère)
Spectre de Masse (ESI) de
l'isoméroréductase en présence de Mg2+,
NADPH et inhibiteur (I).
35
-MALDI (Matrix-Assisted Laser Desorption/Ionisation)
La découverte, faite par Hillenkamp, de la possibilité de désorber des espèces moléculaires de très
haute masse (300 000 Da ou plus) par l'utilisation d'un laser et d'une matrice aromatique cristallisable
a été à peu près simultanée à celle de l'electrospray. Si le défaut de cette technique réside dans la
résolution limitée obtenue sur les pics, elle permet toutefois d'atteindre des masses plus élevées
qu'avec l'electrospray et, surtout, elle semble mieux adaptée à l'étude de mélanges, à la présence de
sels et, de façon générale, à l'analyse des acides nucléiques et des polysaccharides. Dans ces
conditions, l'analyse directe de fluides biologiques semble possible. Très récemment, des
caractérisations de complexes multimériques non covalents de très haute masse ont été rapportées (M
supérieure à 600 000 Da). Toutefois, ces entités présentent des constantes de stabilité extrêmement
élevées et, formées à partir d'une phase cristalline acide, ne peuvent atteindre le degré de spécificité
que l'on connaît en electrospray où elles sont obtenues dans de l'eau tamponnée à pH proche de 7. Il
n'en demeure pas moins que la sensibilité et la facilité de mise en œuvre inégalées des spectromètres
MALDI-TOF ne peuvent que renforcer la place de ces instruments dans le domaine de la mesure de
masse de routine à grande échelle (problèmes liés au protéome et à la "protéomique").
V . 2 La détermination de la séquence
Les séquences peptidiques sont déduites de la présence sur les spectres d'ions-fragments dont les
valeurs de m/z correspondent à des enchaînements d'acides aminés déterminés. L'ionisation des
peptides nécessitant la mise en œuvre de techniques douces (FAB/LSIMS, ESI, MALDI), l'obtention
de fragments reste donc très aléatoire, ce qui implique le plus souvent de recourir à la MS/MS.
Toutefois, la MS/MS n'est applicable qu'à des composés de masse modérée (3000 Daltons est
généralement un maximum). Il faut donc, dans le cas des protéines, recourir à une protéolyse initiale
pour obtenir un mélange de peptides plus courts qui pourront être analysés individuellement par
MS/MS. Par le jeu d'endoprotéases spécifiques (trypsine, Asp-N, …) le recouvrement des séquences
des peptides de digestion permet de remonter à la séquence de la protéine entière. Par ailleurs, dans le
cas de protéines inconnues, les données de poids moléculaire de peptides de digestion ainsi que
quelques éléments de séquence obtenus par MS/MS peuvent être insérés (via Internet) dans des
banques de données de protéines et permettent l'identification de la protéine étudiée. C'est la cause
essentielle du succès de la spectrométrie de masse dans la problématique du protéome.
Nomenclature des fragments peptidiques (Roepstorff et Fohlman complétée par Biemann):
H2NN
HN
H
OH
R1
OR
2
OO
Rn
O
Rn-1
A1Cn-1
Bn-1
An-1
C1
B1
Xn-1 Z1
Yn-1 Zn-1 X1Y1
Ions N-terminaux
An: H-(NH-CHR-CO)n-1-N+H=CHRn
Bn: H-(NH-CHR-CO)n-1-NH-CHRn-CO+
Cn: [H-(NH-CHR-CO)n-NH2 + H]+
Ions C-terminaux
Xn:+OC-NH-CHRn-CO-(NH-CHR-CO)n-1-OH
Yn: [H(NH-CHR-CO)n-OH + H]+
Zn: [CH(=Rn
aRn
b)-CO-(NH-CHR-CO)n-1-OH + H]+
36
C'est la succession, sur un spectre, de fragments de séquence appartenant à la même série (en général
Y ou B, souvent A lorsque l'acide aminé N-terminal est basique) qui permet de reconnaître la séquence
du peptide puisque la différence de m/z entre deux pics de la même série correspond à la masse
caractéristique d'un résidu.
En FAB et LSIMS, des fragments caractéristiques de la séquence peuvent apparaître sur les spectres
qui présentent cependant des inconvénients majeurs:
Ø Présence d'ions issus de la matrice, notamment en basse masse, qui masquent des fragments de
séquence et rendent hasardeuse l'attribution des pics,
Ø Présence d'ions adduits avec la matrice,
Ø Présence éventuelle d'ions cationisés,
Ø Nécessité d'une parfaite pureté du composé.
En electrospray (ESI), il est également possible, par le jeu de la collision à l'interface source/analyseur,
de provoquer la fragmentation du peptide. Toutefois, les performances de cette approche demeurent
relativement limitées, par comparaison avec la MS/MS.
Le séquençage par MS/MS:
Le couplage entre méthodes de désorption et MS/MS est très intéressant en raison de la grande
abondance de molécules protonées [M+H]+, doublement chargées [M+2H]2+ ou cationisées produites à
partir des peptides. Sur ces ions, la collision obtenue en CID de haute énergie sur des instruments
magnétiques (MIKE ou MS/MS) semble plus intéressante que celle obtenue en basse énergie avec des
quadripôles. Les ions fragments obtenus dans ces conditions appartiennent majoritairement aux séries
B et Y.
200 300 400 500 600 700 800 900 m/z
0
50
100 % *
934.4
175.1
288.3 401.3
538.3
639.4
R
IIH
T
Y-NO2
S
847.4
Localisation d'une nitro-tyrosine au sein d'un peptide par activation collisionnelle à l'interface d'une
source electrospray.
1 / 7 100%

Etude des peptides et des protéines par spectrométrie de masse

La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !