Proposition sujet recherche M1 ou M2 2015-2016 Epissage alternatif dans le génome humain: variants fonctionnels ou bien erreurs de la machinerie d'épissage? Directeur: Laurent DURET ([email protected], LBBE – UMR 5558) Chez les mammifères, la très grande majorité des gènes sont soumis à des phénomènes d'épissage alternatif (rétention d'introns, saut d'exons, …). De nombreuses observations indiquent que ce processus peut contribuer à accroitre le répertoire fonctionnel des génomes, et permet également de réguler le niveau d'expression de certains gènes. Cependant, d'autres indices suggèrent qu'une fraction significative des variants d'épissage détectés dans un transcriptome pourrait en fait correspondre à des transcrits non-fonctionnels, résultant simplement d'erreurs de la machinerie d'épissage. Parmi tous les variants d'épissage qui sont produits par un organisme, quelle fraction correspond à des erreurs (couteuses pour l'organisme) et quelle fraction correspond à des variants fonctionnels (utiles à l'organisme)? Cette question reste aujourd'hui encore largement débattue dans la communauté scientifique. Pour y répondre, nous proposons d'analyser les signaux qui régulent l'efficacité de l'épissage des introns (en particulier les sites donneurs et accepteurs d'épissage) pour déterminer les contraintes sélectives qui opèrent sur ces séquences: - étudier des données de transcriptome (chez l'homme) pour quantifier l'efficacité des signaux d'épissage dans différents tissus analyser les corrélations entre efficacité d'épissage et différents paramètres (séquence des signaux d'épissage, composition en base des introns, taille des introns, niveau d'expression des gènes, …) quantifier la pression de sélection sur chaque position des signaux d'épissage par analyse des données de polymorphisme (projet 1000 génomes humains) Ce projet implique d'analyser de gros volumes de données (RNAseq, polymorphisme). L'étudiant devra développer des scripts pour gérer et analyser les données, mettre en œuvre des outils bioinformatiques d'analyse de transcriptomes, et des outils statistiques d'analyse de données (R). L'étudiant utilisera également les concepts de la génomique comparative pour déterminer l'intensité des contraintes fonctionnelles opérant sur les séquences.