L'équipe « Organisation et évolution des génomes des plantes » de l'Unité de recherche en génomique végétale (URGV) propose un sujet de stage de M2 en 2012. Sujet: Développement d'un outil informatique pour la visualisation des données structurales et fonctionnelles des gènes dupliqués chez les Brassica Le gain d'un jeu entier de chromosomes (polyploïdie) est très fréquent dans l'évolution des espèces et a un impact important sur la biodiversité, la dynamique et le fonctionnement des génomes des eucaryotes. Les mécanismes sous-jacents sont peu connus et de nombreuses questions sont à élucider concernant les changements structuraux et fonctionnels dus à la polyploïdie ainsi que le devenir des gènes dupliqués. Pour étudier les effets de la polyploïdie aux niveaux structural et fonctionnel à différentes échelles de temps, notre équipe mène depuis 2009 un projet de séquençage complet du génome du colza (Brassica napus), allopolyploïde récent d'intérêts agronomique et économique majeurs, et des espèces apparentées, possédant elles-mêmes des génomes dupliqués de façon récurrente au cours de l'évolution. Ces génomes hautement dupliqués sont un défi pour la visualisation de données: navigation entre régions et gènes homologues d'un génome à un autre, ou d'une espèce à une autre, détection des ruptures de conservation de l'ordre des gènes, intégration des données obtenues pour chacune des copies des gènes dupliqués (expression, méthylation, etc)... Les outils existants (SynBrowse, Narcisse, Genomicus...) montrent leurs limites, et nous sommes souvent amenés à développer des outils ad-hoc sous forme de scripts. Le stage vise à développer un outil informatique adapté à la visualisation de génomes hautement dupliqués tels que ceux des Brassica, en collaboration avec les bioinformaticiens de l'équipe en charge de l'analyse de la séquence de ces génomes. L'accent sera mis sur la facilité de navigation dans de grandes masses de données; le logiciel est destiné à évoluer, en fonction de la production de nouveaux types de données, tels que les données d'analyses de l'expression des gènes dupliqués obtenues par NGS (séquençage de nouvelle génération). Le stage donnera lieu à des interactions avec les partenaires du projet de séquençage: Génoscope (CEA-CNS, Évry) et APBV (INRA, Rennes). Le candidat devra bien maîtriser au moins un langage de programmation et avoir de solides bases à la fois en développement logiciel et en biologie. Les connaissances nécessaires en génomique, bio-informatique et en statistiques pourront être acquises au cours du stage. Encadrants: Jérémy Just <[email protected]> Boulos Chalhoub <[email protected]> Équipe d'accueil: Organisation et évolution des génomes des plantes Unité de recherche en génomique végétale (URGV) 2, rue Gaston Crémieux, CP 57082 91057 ÉVRY Cedex Site web: http://www.versailles.inra.fr/urgv/ Jérémy JUST <[email protected]>