Unité Biopolymères, Interactions, Assemblages Centre ANGERS-NANTES (Nantes) Algorithme de recherche locale pour la détection de segments transmembranaires D. Tessier Journées de la bioinformatique INRA (21-23/03 2016) Günter Blobel : Prix Nobel de physiologie et de médecine 1999 Certaines protéines nouvellement formées sont dotées d’un signal qui leur permet de se diriger vers la membrane du reticulum endoplasmic Journées de la bioinformatique INRA (21-23/03 2016) Protéines sécrétées Protéines membranaires Peptide signal et signal-anchor sont hydrophobes Journées de la bioinformatique INRA (21-23/03 2016) Comprendre l’insertion de la protéine dans la membrane : Manip in vitro de Hessa et al. Nature 2005 Transcription et traduction in vitro Ingénierie du segment H dans une protéine LEP - Protein Leader Peptidase - par mutagénèse Journées de la bioinformatique INRA (21-23/03 2016) Un segment de la protéine en cours de synthèse est dans le translocon. Si le peptide « ouvre » la porte latérale du translocon => protéine membranaire, sinon protéine secrétée Idées de Hessa et al. A chaque acide aminé, on peut associer un index ‘biological hydrophobicity scale’ qui va être relié à « sa facilité à s’insérer dans la membrane ». Si on combine ces index sur la longueur du peptide inséré dans le translocon, on peut espérer trouver la clé d’ouverture de la porte latérale du translocon. L’index d’un acide aminé peut varier en fonction de sa position dans le translocon. Journées de la bioinformatique INRA (21-23/03 2016) Question : Est-ce que l’on peut apprendre in silico le « code » qui permet à certaines protéines d’ouvrir la porte latérale du translocon et de s’insérer dans la membrane ? 1. Constituer le jeu d’apprentissage et les jeux d’évaluation de la méthode 2. Choisir un algorithme d’apprentissage : commencer par des approches très simples pour raisonner sur le comportement des données => donner un sens biologique Journées de la bioinformatique INRA (21-23/03 2016) Constituer le jeu d’apprentissage et les jeux d’évaluation de la méthode Constitution d’un jeu d’apprentissage encore jamais utilisé composé de . Protéines avec un signal-peptide . Protéines avec un signal-anchor 2 signaux qui amènent la protéine vers le RE, mais l’un va traverser la membrane et l’autre s’insérer dedans Elargissement aux protéines dont on ne connaît pas la structure 3D avec une localisation des segments approximatifs 7 Notre choix s’est porté sur un algorithme de recherche locale Principe : Pour résoudre un problème compliqué, on part d’une solution initiale, la moins mauvaise possible et l’algorithme va chercher à améliorer cette solution par itérations successives L’algorithme Solution = S0 Jusqu’à plus d’amélioration faire • Je construis des solutions voisines S1, S2, S3, ......S10 • J’évalue chacune des solutions • Parmi les solutions voisines, je choisis la meilleure solution qui devient la solution courante fait Journées de la bioinformatique INRA (21-23/03 2016) A: 1.85 C: 2.57 D: -3.42 E : -3.54 …… Peptide-signal A: 1.8 C: 2.5 Classifieur D: -3.5 Choix du meilleur voisin E : -3.5 …… Peptide-anchor Jeu d’apprentissage Jeu de test Courbe ROC La méthode Journées de la bioinformatique INRA (21-23/03 2016) La recherche locale => vers un optimum local Méthode de descente : classique, simple, plusieurs façons de choisir le meilleur voisin . Pour ne pas rester bloqué sur un optimum local => appliquer une perturbation => définir un critère d’arrêt (temps d’exec, nombre total d’évaluations,….) . Le recuit simulé : on accepte des solutions de moins bonne qualité avec une probabilité non nulle . La recherche tabou : la méthode interdit de se déplacer vers une solution récemment visitée . Méthodes à population de solutions Journées de la bioinformatique INRA (21-23/03 2016) Conclusion de ce travail Proposition d’une nouvelle échelle d’index d’insertion PMIscale avec des valeurs et non des courbes Ce nouvel index fonctionne très bien pour distinguer le signal peptide d’un ‘signal anchor’ et pas trop mal pour déterminer plus généralement les TM d’une protéine. Différentiation de 2 seuils : l’un pour le premier TM et un second pour les suivants Laroum S. et al. (2010). A Local Search Appproach for Transmembrane Segment and Signal Peptide Discrimination, Evolutionary Computation, Machine Learning and Data Mining in Bioinformatics, Proceedings (Vol. 6023, pp. 134-145 Laroum S. et al. (2011). Multi-Neighborhood Search for Discrimination of Signal Peptides and Transmembrane Segments), Evolutionary Computation, Machine Learning and Data Mining in Bioinformatics (Vol. 6623, pp. 111-122). Tessier D. et al. (2014). In silico evaluation of the influence of the translocon on partitioning of membrane segments. BMC Bioinformatics, 15, 7. Journées de la bioinformatique INRA (21-23/03 2016) Ce travail a été réalisé en collaboration avec Jin-Kao Hao, Béatrice Duval Sami Laroum, doctorant 2019-2012 Emma R. Rath et Bret Church Journées de la bioinformatique INRA (21-23/03 2016) http://www.canoz.com/benchmark/benchmark.pl Rath E.M. et al.. (2013). A benchmark server using high resolution protein structure data, and benchmark results for membrane helix predictions. BMC Bioinformatics, 14, 10. Journées de la bioinformatique INRA (21-23/03 2016)