Algorithme de recherche locale pour la détection de segments

publicité
Unité
Biopolymères, Interactions,
Assemblages
Centre ANGERS-NANTES
(Nantes)
Algorithme de recherche locale pour la
détection de segments
transmembranaires
D. Tessier
Journées de la bioinformatique INRA (21-23/03 2016)
Günter Blobel : Prix Nobel de physiologie
et de médecine 1999
Certaines protéines nouvellement
formées sont dotées d’un signal qui
leur permet de se diriger vers la
membrane du reticulum endoplasmic
Journées de la bioinformatique INRA (21-23/03 2016)
Protéines sécrétées
Protéines membranaires
Peptide signal et signal-anchor sont hydrophobes
Journées de la bioinformatique INRA (21-23/03 2016)
Comprendre l’insertion de la protéine dans la membrane :
Manip in vitro de Hessa et al. Nature 2005
Transcription et traduction in vitro
Ingénierie du segment H dans une protéine
LEP - Protein Leader Peptidase - par
mutagénèse
Journées de la bioinformatique INRA (21-23/03 2016)
Un segment de la protéine en cours de
synthèse est dans le translocon. Si le peptide
« ouvre » la porte latérale du translocon =>
protéine membranaire, sinon protéine
secrétée
Idées de Hessa et al. A chaque acide aminé, on peut associer un
index ‘biological hydrophobicity scale’ qui va être relié à « sa facilité
à s’insérer dans la membrane ». Si on combine ces index sur la
longueur du peptide inséré dans le translocon, on peut espérer
trouver la clé d’ouverture de la porte latérale du translocon.
L’index d’un acide aminé peut varier en fonction de sa
position dans le translocon.
Journées de la bioinformatique INRA (21-23/03 2016)
Question : Est-ce que l’on peut apprendre in silico le « code » qui permet à certaines
protéines d’ouvrir la porte latérale du translocon et de s’insérer dans la membrane ?
1. Constituer le jeu d’apprentissage et les jeux d’évaluation de la méthode
2. Choisir un algorithme d’apprentissage : commencer par des approches très simples
pour raisonner sur le comportement des données => donner un sens biologique
Journées de la bioinformatique INRA (21-23/03 2016)
Constituer le jeu d’apprentissage et les jeux d’évaluation de la méthode
Constitution d’un jeu d’apprentissage encore jamais utilisé composé de
. Protéines avec un signal-peptide
. Protéines avec un signal-anchor
2 signaux qui amènent la protéine vers le
RE, mais l’un va traverser la membrane et
l’autre s’insérer dedans
Elargissement aux protéines dont on ne connaît pas la structure 3D avec
une localisation des segments approximatifs
7
Notre choix s’est porté sur un algorithme de recherche locale
Principe : Pour résoudre un problème compliqué, on part d’une solution initiale, la moins
mauvaise possible et l’algorithme va chercher à améliorer cette solution par itérations
successives
L’algorithme
Solution = S0
Jusqu’à plus d’amélioration faire
• Je construis des solutions voisines S1, S2, S3, ......S10
• J’évalue chacune des solutions
• Parmi les solutions voisines, je choisis la meilleure solution qui
devient la solution courante
fait
Journées de la bioinformatique INRA (21-23/03 2016)
A: 1.85
C: 2.57
D: -3.42
E : -3.54
……
Peptide-signal
A: 1.8
C: 2.5
Classifieur
D: -3.5
Choix du meilleur voisin
E : -3.5
……
Peptide-anchor
Jeu d’apprentissage
Jeu de test
Courbe ROC
La méthode
Journées de la bioinformatique INRA (21-23/03 2016)
La recherche locale => vers un optimum local
Méthode de descente : classique, simple, plusieurs façons de choisir le meilleur voisin
. Pour ne pas rester bloqué sur un optimum local
=> appliquer une perturbation
=> définir un critère d’arrêt (temps d’exec, nombre total d’évaluations,….)
. Le recuit simulé : on accepte des solutions de moins bonne qualité avec une probabilité non
nulle
. La recherche tabou : la méthode interdit de se déplacer vers une solution récemment visitée
. Méthodes à population de solutions
Journées de la bioinformatique INRA (21-23/03 2016)
Conclusion de ce travail
Proposition d’une nouvelle échelle d’index d’insertion PMIscale avec des valeurs et non des
courbes
Ce nouvel index fonctionne très bien pour distinguer le signal peptide d’un ‘signal anchor’ et pas
trop mal pour déterminer plus généralement les TM d’une protéine.
Différentiation de 2 seuils : l’un pour le premier TM et un second pour les suivants
Laroum S. et al. (2010). A Local Search Appproach for Transmembrane Segment and Signal Peptide Discrimination, Evolutionary Computation, Machine
Learning and Data Mining in Bioinformatics, Proceedings (Vol. 6023, pp. 134-145
Laroum S. et al. (2011). Multi-Neighborhood Search for Discrimination of Signal Peptides and Transmembrane Segments), Evolutionary Computation, Machine
Learning and Data Mining in Bioinformatics (Vol. 6623, pp. 111-122).
Tessier D. et al. (2014). In silico evaluation of the influence of the translocon on partitioning of membrane segments. BMC Bioinformatics, 15, 7.
Journées de la bioinformatique INRA (21-23/03 2016)
Ce travail a été réalisé en collaboration avec
Jin-Kao Hao,
Béatrice Duval
Sami Laroum, doctorant
2019-2012
Emma R. Rath et Bret Church
Journées de la bioinformatique INRA (21-23/03 2016)
http://www.canoz.com/benchmark/benchmark.pl
Rath E.M. et al.. (2013). A benchmark server using high resolution protein structure data, and benchmark results for membrane helix
predictions. BMC Bioinformatics, 14, 10.
Journées de la bioinformatique INRA (21-23/03 2016)
Téléchargement