Introduction à Cytoscape Qu’est ce que Cytoscape ? Que peut-on imaginer réaliser avec Cytoscape ? Cytoscape est une plate-forme logicielle bioinformatique dont les fonctionnalités recoupent partiellement celles d’outils commerciaux comme Ingenuity IPA ou Genomatix Bibliosphere, avec l’avantage d’être ouvert, extensible et de bénéficier des efforts d’une large communauté de développeurs. Même si aujourd’hui les sources de données directement exploitables dans Cytoscape ne sont pas encore très fournies, l’intégration d’un connecteur exploitant les données de pathwaycommons.org permet de considérer Cytoscape comme un outil de référence pour l’exploitation des données de réseaux d’interactions. Cytoscape permet notamment d’explorer les interactions d’un groupe de gènes, d’interpréter des résultats de microarray ou de modéliser des régulations génétiques ou métaboliques. Aujourd’hui, aucun logiciel, qu’il soit commercial ou non, ne propose des jeux de données d’interactions moléculaires exhaustifs, à fortiori pour les eucaryotes. La recherche puis la génération d’un jeu de données d’interactions le plus complet possible constitue donc une phase préalable cruciale et parfois limitante en fonction du thème d’étude. Qu’elles sont les fonctionnalités de Cytoscape ? Cytoscape est un logiciel permettant de visualiser les réseaux d’interactions moléculaires et les voies métaboliques, avec leurs annotations, leurs profils d’expression ou d’autres attributs associés. Même si Cytoscape a été initialement conçu pour la recherche en biologie, c’est maintenant une plate-forme logicielle générique pour la visualisation et l’analyse des réseaux complexes. Comment est conçu Cytoscape ? La distribution Cytoscape core fournie des outils de base pour l’intégration de données et leur visualisation. Des fonctionnalités avancées sont mises à disposition sous forme de plugins. Les plugins sont par exemple des outils d’analyse de réseaux moléculaires, de layout, de support d’importation de formats de fichier additionnels, de scripting,ou de connection aux bases de données. Les plugins peuvent être développés par quiconque et utilisent l’interface de programmation ouverte de Cytoscape en langage JAVA. La plupart des plugins sont disponibles gratuitement. 1ère étape : Découvrir les sources de données d’interactions Nous allons brièvement étudier les différentes sources de données d’interactions disponibles et étudier le type de données qu’elles contiennent. Exercice 1.1 : Les sources de données Vous allez naviguer sur les différents sites web donnant l’accès à des sources de données d’interactions Les sources de données d’interactions potentiellement exploitables Publiques : BioModels, IntAct, Reactome, Pathway Commons , KEGG, PID Privées : Ingenuity IPA, Genomatix Bibliosphere, Biobase Transpath… Connaissez-vous d’autres sources de données d’interactions ? Si oui, listez-les. Les types d’interactions A partir des sites web explorés dans l’exercice 1, vous allez lister dans le tableau suivant les types d’interactions disponibles (ex : protéine - protéine) par source de données, ainsi que le type d’entités biologiques concernées (ex : gène). Source Type(s) d’interactions Type(s) d’entités Exercice 1.2 : Les sources de données sont elles directement exploitables ? Certaines sources de données sont directement intégrées à des outils d’exploration et de visualisation, lesquelles ? L’exportation des données d’interaction est elle possible ? Si oui, en quel format ? Exercice 1.3 : Quelles sont les données disponibles pour mon sujet d’étude ? Dans quel(s) cas vous trouvez vous ? vous étudiez un groupe restreint de gènes ou protéines en particulier ; vous exploitez les annotations de l’humain, du rat ou de la souris via des identifiants de référence comme l’official symbol HGNC ; vous étudiez une ou des voix métaboliques en particulier ; vous avez à disposition une liste de publications scientifiques que vous jugez suffisamment exhaustive pour permettre de déduire un réseau d’interactions ; vous disposez de résultats d’expériences permettant de déduire des interactions ; votre sujet ne semble pas suffisamment étudié pour permettre une approche réseau d’interactions ; autres : préciser votre cas : Quelles sont les sources et types de données adaptés à votre projet de recherche ? Comptez-vous utiliser les sources de données existantes ou créer une source de données personnalisée ? Exercice 1.4 : Présentation de l’interface de Cytoscape. Découvrez l’interface de Cytoscape avec les liens du schéma suivant qui poointent vers des films de présentation Gestion de la mise en forme 2D des graphes (« layout ») Zoom Editeur de graphe Recherche et indexation Gestion des fichiers Onglet de gestion des reseaux Editeur et sélecteur de style graphique « VizMapper » Vue navigateur Panneau des données 2ième étape : Mon premier réseau dans Cytoscape Exercice 2.1 : Installation de Cytoscape Téléchargement de Cytoscape Pour utiliser Cytoscape, vous pouvez télécharger la dernière version du logiciel à partir site cytoscape.org. La version avec laquelle ont été réalisés ces exercices est la 2.5.1 ; La version 2.5.1, 2.5.2 et 2.6 conviennent. (Cytoscape nécessite JAVA Standard Edition 5 ou 6, voir le site de sun microsystems). Une version préconfigurée de Cytoscape est également disponible sur la page de la formation. Java Web Start Une autre solution est l’utilisation d’un lien vers un fichier Java Web Start, si votre installation de Java le permet. L’installation Java Web Start permet en un clic de souris de télécharger, mettre à jour, configurer les plugins, charger les données et utiliser Cytoscape. C’est la solution la plus simple que vous pouvez découvrir en allant sur le site http://www.pathwaycommons.org (effectuez une recherche, par exemple "PPAR" et cliquez sur le premier lien View network neighborhood in Cytoscape. Cytoscape sera téléchargé avec certains plugins, puis lancé avec les données d’entrée correspondant à la recherche effectuée. ¾ voir un exemple en vidéo Exercice 2.2 : Charger des données d’interactions Charger des données de réseau à partir d’un fichier Nous allons charger un fichier exemple de données d’interactions au format .sif. Ce fichier décrit un graphe dont les nœuds sont associés à des identifiants numériques (ex : 25898) et les arcs à des types d’interaction (ex : COMPONENT_OF). Les lignes sont composées de trois champs séparés par des tabulations : Exemple : ID_noeud1 type_interaction ID_noeud2 25898 COMPONENT_OF 25895 Nous allons ouvrir le fichier presenilin.sif dans un éditeur de texte pour examiner son contenu puis dans Cytoscape avec le menu File/import/network(multiple file types). ¾ voir un exemple en vidéo Il est également possible de réaliser l’importation à partir d’une URL : ¾ voir un exemple en vidéo Charger des données d’annotations à partir d’un fichier Les nœuds et arcs du graphe d’interactions peuvent être associés à des attributs permettant l’annotation. Par exemple, un nœud représentant un gène peut être associé à une série d’alias de nom, un arc représentant une interaction gène/ protéine peut être associé au type d’interaction (inhibition, activation…) Attribut de nœud : ¾ voir un exemple en vidéo Attribut d’arc : ¾ voir un exemple en vidéo Comme sur la vidéo, importez les fichiers d’attributs de nœud biopax.comment.NA et biopax.xref.UNIPROT.NA puis utilisez la Data panel pour visualiser et explorer les attributs. Exercice 2.3 : Outils de sélection De nombreux outils permettent la sélection de sous éléments du graphe. Voisinage On peut par exemple sélectionner les nœuds voisins et arcs d’un nœud donné : ¾ voir un exemple en vidéo Remarque : des plugins permettent d’étendre ces fonctionnalités de sélection. Filtre On peut également filtrer les nœuds par valeur d’attribut : ¾ voir un exemple en vidéo Exercice 2.4 : Les connecteurs à des sources online d’interactions Nous allons découvrir une puissante fonctionnalité de Cytoscape : les connecteurs cPath / Pathways commons qui permettent de rechercher des interactions online et de créer un réseau dans Cytoscape. CPath Première version du connecteur vers Pathways commons (CPath) ¾ voir un exemple en vidéo Connecteur Web Service Seconde version avec recherche avancée (connecteur Web Service vers Pathways commons) ¾ voir un exemple en vidéo Exercice 2.5 : Utiliser des plugins Les plugins permettent d’effectuer des traitements d’analyse, de visualisation, d’exportation, d’importation, etc. Ces outils étendent les possibilités offertes par la version core de Cytoscape. Installation Pour utiliser des plugins, plusieurs solutions s’offrent à vous : - Vous pouvez installer l’archive .jar du plugin dans le répertoire plugins de Cytoscape - Vous pouvez utiliser le plugins manager : ¾ voir la vidéo - Vous pouvez également dans certains cas utiliser Cytoscape déjà configuré par Java Web Start avec les plugins de votre choix : ¾ Java Web Start Exemples de plugins Voici quelques exemples de plugins intéressants : APID2NET : Fonctionnalités : connecteur base de données d’interactions et d’annotations, annotation GO, groupes. URL: http://bioinfow.dep.usal.es/apid/apid2net.html ¾ voir la vidéo FCModeler : Fonctionnalités : trouver des chemins dans un réseau, sélection de voisinage, création de sous graphes. URL : http://metnetdb.org/MetNet_fcmodeler_cytoscape_main.htm ¾ voir la vidéo BINGO : Fonctionnalités : annotation GO et test de sur-représentativité des classes GO. URL : http://www.psb.ugent.be/cbd/papers/BiNGO/ ¾ voir la vidéo GOSLIMMER : Fonctionnalités : conversion d’un graphe Gene Ontology en un graphe synthétique exprimant la couverture d’un groupe de gènes donné. URL : http://yeastgenomics.ca/resources ¾ voir la vidéo BiNoM : Fonctionnalités : import, export BioPAX, SBML, format CellDesigner, analyse de réseaux. URL : http://bioinfo-out.curie.fr/projects/binom/ Autres plugins La page http://www.cytoscape.org/plugins2.php référence les plugins disponibles : Choisissez un plugin d’intérêt, installez-le puis cherchez à l’utiliser. Remarque : en général, il faut installer l’archive .jar du plugin dans le répertoire plugins de Cytoscape puis relancer Cytoscape. Attention cette procédure n’est pas applicable pour un Cytoscape déjà lancé à partir de Java Web Start. Conclusion Cette introduction à Cytoscape est terminée. Nous espérons vous avoir montré les potentialités de Cytoscape dans le cadre d’une approche réseaux d’interactions. Vous pouvez approfondir votre maîtrise de Cytoscape avec les cours en lignes disponibles sur le site de Cytoscape. A vous de jouer !