1
Modélisation des protéines
Du génome à la structure protéique
...GCGGGACTCAAGAGTAGCCTTCCTCGAGGACCTGC
CTTTCCCATTTGCTGCCTGAAGTTAATGTTTCTTGCTG
GCCAAATCAGGGACATGCCGGCATTAGCGGGATGAGTG
GGTGTTCCGGCAGGGATGTGGTCATTGACGGCCAGTGA
GGGCGAGAGTACCACGGCCCACTTCTTCCTTGGAGCTG
GAGATGAGGGGCTGGGCACCCGTGGAATAGGCATGAGG
CCAGAAGAGAGTGACAGCGAGCTCCTTGAGGATGAGGA
GGATGAAGTGCCTCCTGAACCTCAGATCATTGTTGGCA
TCTGTGCCATGACCAAGAAATCCAAGTCCAAGCCAATG
ACTCAAATCCTAGAGCGACTCTGCAGATTTGACTACCT
GACTGTTGTCATTCTGGGAGAAGATGTAATCCTTAATG
AACCTGTGGAAAACTGGCCATCCTGCCACTGCCTCATC
TCTTTCCACTCCAAAGGCTTTCCTCTGGACAAAGCTGT
TGCTTACTCCAAGCTTCGAAACCCCTTTCTTATCAATG
ATCTGGCCATGCAGTATTACATCCAAGATAGGAGGGAG
GTGTACCGGATCCTGCAGGAAGAGGGTATTGATCTGCC
TCGATATGCTGTGCTCAACCGTGATCCTGCCCGGCCTG
AGGAATGCAACCTGATAGAAGGTGAAGACCAAGTAGAG
GTCAATGGAGCTGTCTTTCGATCCTGCAGGAAGCT...
?
De la séquence d’ADN à la
quence protéique
...GCGGGACTCAAGATGAGCCTTCCTCGAGGACCTGC
CTTTCCCATTTGCTGCCTGAAGTTAATGTTTCTTGCTG
GCCAAATCAGGGACATGCCGGCATTAGCGGGATGAGTG
GGTGTTCCGGCAGGGATGTGGTCATTGACGGCCAGTGA
GGGCGAGAGTACCACGGCCCACTTCTTCCTTGGAGCTG
GAGATGAGGGGCTGGGCACCCGTGGAATAGGCATGAGG
CCAGAAGAGAGTGACAGCGAGCTCCTTGAGGATGAGGA
GGATGAAGTGCCTCCTGAACCTCAGATCATTGTTGGCA
TCTGTGCCATGACCAAGAAATCCAAGTCCAAGCCAATG
ACTCAAATCCTAGAGCGACTCTGCAGATTTGACTACCT
GACTGTTGTCATTCTGGGAGAAGATGTAATCCTTAATG
AACCTGTGGAAAACTGGCCATCCTGCCACTGCCTCATC
TCTTTCCACTCCAAAGGCTTTCCTCTGGACAAAGCTGT
TGCTTACTCCAAGCTTCGAAACCCCTTTCTTATCAATG
ATCTGGCCATGCAGTATTACATCCAAGATAGGAGGGAG
GTGTACCGGATCCTGCAGGAAGAGGGTATTGATCTGCC
TCGATATGCTGTGCTCAACCGTGATCCTGCCCGGCCTG
AGGAATGCAACCTGATAGAAGGTGAAGACCAAGTAGAG
GTCAATGGAGCTGTCTTTCGTAGCTGCAGGAAGCT...
MGKAAKKKYSGATSSKQVSAEKHLS
SVFKFNTDLGQHILKNPLVAQGIVD
KAQIRPSDVVLEVGPGTGNLTVRIL
EQAKNVVAVEMDPRMAAELTKRVRG
TPVEKKLEIMLGDFMKTELPYFDIC
ISNTPYQISSPLVFKLINQPRPPRV
SILMFQREFALRLLARPGDSLYCRL
SANVQMWANVTHIMKVGKNNFRPPP
QVESSVVRLEIKNPRPQVDYNEWDG
LLRIVFVRKNRTISAGFKSTTVMDI
LEKNYKTFLAMNNEMVDDTKGSMHD
VVKEKIDTVLKETDLGDKRAGKCDQ
NDFLRLLYAFHQVGIHF
Chaque acide aminé est codé par un triplet de nucleotides (codon)
Chaque protéine commence par un ‘codon d’initiation’ et termine par un ‘
codon stop’
2
Les protéines ont une
structure tridimensionelle
La structure tridimensionelle (fold) d’une protéine
correspond à l’arrangement de ses acides aminés dans
l’espace 3D.
MGKAAKKKYSGATSSKQVSAEKHLS
SVFKFNTDLGQHILKNPLVAQGIVD
KAQIRPSDVVLEVGPGTGNLTVRIL
EQAKNVVAVEMDPRMAAELTKRVRG
TPVEKKLEIMLGDFMKTELPYFDIC
ISNTPYQISSPLVFKLINQPRPPRV
SILMFQREFALRLLARPGDSLYCRL
SANVQMWANVTHIMKVGKNNFRPPP
QVESSVVRLEIKNPRPQVDYNEWDG
LLRIVFVRKNRTISAGFKSTTVMDI
LEKNYKTFLAMNNEMVDDTKGSMHD
VVKEKIDTVLKETDLGDKRAGKCDQ
NDFLRLLYAFHQVGIHF
Importance de la structure
3D des protéines
La structure 3D des protéines est une source importante
d’information
pour comprendre sa fonction
pour imaginer des mutations
Le nombre des protéines de structure connue (9000) est
sensiblement plus faible que celui des protéines connues (600000).
Le problème est que les techniques expérimentales de détermination
de la structure 3D des protéines sont longues et coûteuses
Il existe une alternative: la modélisation des protéines
3
Modélisation des protéines:
Pourquoi ça marche?
La modélisation 3D des protéines est basée sur le
fait que des protéines similaires adoptent le même
fold.
Il est possible de prédire un fold approximatif
pour une protéine d’intérêt à partir d ’une
protéine similaire de structure connue (template)
Modélisation des protéines:
Recherche en banques de données de
structures connues
Le premier pas dans la modélisation des protéines consiste à
rechercher une protéine similaire de structure connue (template)
dans les banques de données. Le résultat est une liste de protéines
similaires triées par un score. Plus le score est haut, plus la
similarité avec la protéine d’intérêt est grande.
Score E
Sequences producing significant alignments: (bits) Value
pdb|1YUB| Solution Structure Of An Rrna Methyltransferase... 58 1e-09
pdb|1QAN|A Chain A, The Structure Of The Rrna Methyltransfe... 53 6e-08
pdb|1G6Q|1 Chain 1, Crystal Structure Of Yeast Arginine Met... 31 0.28
pdb|1EI1|A Chain A, Dimerization Of E. Coli Dna Gyrase B Pr... 29 1.1
pdb|3HDH|A Chain A, Pig Heart Short Chain L-3-Hydroxyacyl C... 27 2.4
pdb|1PSZ|A Chain A, Pneumococcal Surface Antigen Psaa 27 3.2
pdb|1VID| Catechol O-Methyltransferase
26 7.2
4
Modélisation des protéines:
Alignement séquence-structure
Le deuxième pas dans la modélisation des protéines est
l’alignement entre la sequence de la protéine d’intérêt
(DIM1p) et le template (1YUB)
DIM1p MGKAAKKKYSGATSSKQVSAEKHLSSVFKFNTDLGQHILKNPLVAQGIVDKAQIRPSDVV
1YUB ---------------------------MNKNIKYSQNFLTSEKVLNQIIKQLNLKETDTV
DIM1p LEVGPGTGNLTVRILEQAKNVVAVEMDPRMAAELTKRVRGTPVEKKLEIMLGDFMKTELP
1YUB YEIGTGKGHLTTKLAKISKQVTSIELDSHLFNLSSEKLK---LNTRVTLIHQDILQFQFP
DIM1p YFD--ICISNTPYQISSPLVFKLINQPRPPRVSILMFQREFALRLLARPGDSLYCRLSAN
1YUB NKQRYKIVGNIPYHLSTQIIKKVVFESRASDI-YLIVEEGFYKRTLD-----IHRTLGLL
DIM1p VQMWANVTHIMKVGKNNFRPPPQVESSVVRLEIKNPRPQVDYNEWDGLLRIVFVRKNRTI
1YUB LHTQVSIQQLLKLPAECFHPKPKVNSVLIKLTRHTTDVPDKY--WK--LYTYFVSK----
DIM1p SAGFKSTTVMDILEKNYKTFLAMNNEMVDDTKGSMHDVVKEKIDTVLKETDLGDKRAGKC
1YUB -----------WVNREYRQLFTKN-----------------QFHQAMKHAKVNN--LSTI
DIM1p DQNDFLRLLYAFHQVGIHF
1YUB
TYEQVLSIFNSYLLFNGR-
Modélisation des protéines:
Assignation des coordonnées
Le troisième pas dans la modélisation de protéines est de construire le
modèle 3D de la protéine d’intérêt. Dans cette procédure, les acides
aminés du template sont remplacés par ceux qui sont alignés dans la
protéine d’intérêt.
DIM1p ...LEVGPGTGNLTVRILEQAKNV...
1YUB ...YEIGTGKGHLTTKLAKISKQV...
Y E
I
G
T
G K G
H
L
1YUB
5
Modélisation des protéines:
Assignation des coordonnées
DIM1p ...LEVGPGTGNLTVRILEQAKNV...
1YUB ...YEIGTGKGHLTTKLAKISKQV...
LE
I
G
T
G K G
H
L
1YUB
Le troisième pas dans la modélisation de protéines est de construire le
modèle 3D de la protéine d’intérêt. Dans cette procédure, les acides
aminés du template sont remplacés par ceux qui sont alignés dans la
protéine d’intér
êt.
Modélisation des protéines:
Assignation des coordonnées
DIM1p ...LEVGPGTGNLTVRILEQAKNV...
1YUB ...YEIGTGKGHLTTKLAKISKQV...
LE
I
G
T
G K G
H
L
1YUB
Le troisième pas dans la modélisation de protéines est de construire le
modèle 3D de la protéine d’intérêt. Dans cette procédure, les acides
aminés du template sont remplacés par ceux qui sont alignés dans la
protéine d’intér
êt.
1 / 9 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !