L'équipe « Organisation et évolution des génomes des plantes » de
l'Unité de recherche en génomique végétale (URGV) propose un sujet de
stage de M2 en 2012.
Sujet: Développement d'un outil informatique pour la visualisation des
données structurales et fonctionnelles des gènes dupliqués chez les
Brassica
Le gain d'un jeu entier de chromosomes (polyploïdie) est très
fréquent dans l'évolution des espèces et a un impact important sur la
biodiversité, la dynamique et le fonctionnement des génomes des
eucaryotes. Les mécanismes sous-jacents sont peu connus et de
nombreuses questions sont à élucider concernant les changements
structuraux et fonctionnels dus à la polyploïdie ainsi que le devenir
des gènes dupliqués.
Pour étudier les effets de la polyploïdie aux niveaux structural et
fonctionnel à différentes échelles de temps, notre équipe mène depuis
2009 un projet de séquençage complet du génome du colza (Brassica
napus), allopolyploïde récent d'intérêts agronomique et économique
majeurs, et des espèces apparentées, possédant elles-mêmes des génomes
dupliqués de façon récurrente au cours de l'évolution.
Ces génomes hautement dupliqués sont un défi pour la visualisation
de données: navigation entre régions et gènes homologues d'un génome à
un autre, ou d'une espèce à une autre, détection des ruptures de
conservation de l'ordre des gènes, intégration des données obtenues
pour chacune des copies des gènes dupliqués (expression, méthylation,
etc)... Les outils existants (SynBrowse, Narcisse, Genomicus...)
montrent leurs limites, et nous sommes souvent amenés à développer des
outils ad-hoc sous forme de scripts.
Le stage vise à développer un outil informatique adapté à la
visualisation de génomes hautement dupliqués tels que ceux des
Brassica, en collaboration avec les bioinformaticiens de l'équipe en
charge de l'analyse de la séquence de ces génomes. L'accent sera mis
sur la facilité de navigation dans de grandes masses de données; le
logiciel est destiné à évoluer, en fonction de la production de
nouveaux types de données, tels que les données d'analyses de
l'expression des gènes dupliqués obtenues par NGS (séquençage de
nouvelle génération).
Le stage donnera lieu à des interactions avec les partenaires du
projet de séquençage: Génoscope (CEA-CNS, Évry) et APBV (INRA, Rennes).
Le candidat devra bien maîtriser au moins un langage de
programmation et avoir de solides bases à la fois en développement
logiciel et en biologie. Les connaissances nécessaires en génomique,
bio-informatique et en statistiques pourront être acquises au cours du
stage.
Équipe d'accueil: Organisation et évolution des génomes des plantes
Unité de recherche en génomique végétale (URGV)
2, rue Gaston Crémieux, CP 57082
91057 ÉVRY Cedex
Site web: http://www.versailles.inra.fr/urgv/