Définition La synténie : Groupe de gènes dont le voisinage et l’organisation sont conservés sur plusieurs génomes La synténie se caractérise par 2 types de relations : définition(s), détection, intérêt en Génomique Comparative et Evolutive • Relation de "co-localisation" (intra génome) • Relation de "correspondance" (inter génomes) co-localisation Génome A correspondance Génome B co-localisation Co-localisation intra génome co-localisation Génome A correspondance Génome B co-localisation Etre présent sur le même chromosome (définition initiale, notion eucaryote) Etre voisin sur le chromosome, notion de distance et choix d’un seuil … Utiliser la position physique (en pb) sur le chromosome ou une numérotation relative à l’ordre des gènes sur le chromosome NB : pour les génomes circulaires (type bactériens), il faut « linéariser » le chromosome Co-localisation intra génome co-localisation Génome A correspondance Génome B co-localisation Etre présent sur le même chromosome (notion eucaryote) Etre voisin sur le chromosome, notion de distance et choix d’un seuil … Utiliser la position physique (en pb) sur le chromosome ou une numérotation relative à l’ordre des gènes sur le chromosome NB : pour les génomes circulaires (type bactériens), il faut « linéariser » le chromosome 1 Correspondance inter génomes co-localisation Génome A Intérêts correspondance Génome B co-localisation Au niveau nucléique (séquence génomique totale) Au niveau protéique : Protéines des gènes orthologues Protéines des gènes homologues (paralogues + orthologues) Autres critères (classifications fonctionnelles, domaines protéiques partagés, etc.) • Annotation : Interaction physique et/ou fonctionnelles (opérons, clusters de gènes) • Identification des ortologues parmi les homologues • Etude de la dynamique des génomes : Identification de réarrangements (transpositions, délétions, insertions, inversions, fusions/fissions) Intérêts Espèce A exemple Espèce B Génome A A1 A2 A3 A4 A5 … A86 A87 A88 A89 A90 A91 A92 B1 BDBH, RBH B2 Duplication/Deletion B3 Nouveaux genes, annotations B4 Orthologues/Paralogues B5 B6 Seuil détection B7 … B234 B235 B236 Réarrangements chromosomiques B237 B238 B239 gap <= 2 Génome B Réarrangement Fusion Duplication Insertion Inversion Rq : Correspondances multiples, différents réarrangements et insertions 2 Macro- et micro-synténie Gène : G1 G2 G3 G4 G5 G6 Détection G7 Espèce 1 Espèce 2 Espèce 3 Espèce 4 Espèce 5 Espèce 6 Microsynténie Macrosynténie Dotplot de Génomes complets Dotplot de Génomes complets 3 Dotplot de Génomes complets Dotplot de Génomes complets Bacillus subtilis Régions conservées Eisen et al., 2000 Artemis Comparison Tool Escherichia coli k12 Artemis Comparison Tool E. coli S. typhi S. typhimurium Neisseria meningitidis serogroup A versus serogroup B 4 ADHoRe: Eukaryotic genomes Algo « Syntonizer » 1 c1 c2 c3 S. cerevisiae 4 c4 c5 c6 c7 1 c8 c2 c3 c4 c5 c6 2 2 c2 c3 c4 c5 c6 ccA2/ccB3 Y. lipolytica 2 gene a c7 c2 c3 c4 ccA1 c8 c5 c6 c7 c6 c7 ccB1 ccB2 c2 c3 c4 c5 ccB3 2 C. glabrata c8 ccA2 gap <= 1 c1 S.cerevisiae Model organism D. hansenii Cryotolerant, halotolerant marine yeast Alkane-using yeast Genome 1 c1 ccA2/ccB2 K. lactis c8 4 1 c1 c7 2 1 ccA1/ccB1 Human pathogen 4 1 c1 C. glabrata K. lactis 2 G e n o m e c8 2 gene b gene c gene d gene e gene f gene g gene h gene i gene j gene 1 gene 2 gene 3 gene 4 gene 5 gene 6 gene 7 gene 8 gene 9 gene 10 gene 11 gene 12 gene 13 gene 14 gene 15 gene 16 gap r2 synteny blocks 10 inter-comparisons D. hansenii S.cerevisiae C. glabrata K. lactis C. glabrata D. hansenii Y. lipolytica 88% of the genomes are conserved within synteny blocks 5 Combinatorics of signed permutations Combinatorics of signed permutations Gene loss Genome reduction in Buchnera Quelques exemples Moran et al., 2001 6 w w YM L0 YM YM 48 L0 w YM 49 w L0 YJ 51 R0 w YJ 56 c R0 58 YM c Gene duplication/loss w R0 R0 55 57 w w 54 R0 L0 YM 48 L0 w YM 49 w 49 w L0 YJ 51 w 51 w R0 YJ 56 c L0 R0 58 c 58 c 58 c w 57 YJ YJ R0 R0 55 54 R0 YJ YM 46 w w w 53 R0 YJ R0 YJ R0 YJ R0 YJ w L0 52 w 57 w 55 54 YM 46 w YM L0 48 w w w R0 R0 L0 w DUPLICATION YJ YJ YJ R0 52 53 w K. lactis : YJ R0 52 w YM L0 46 w YJ R0 53 w K. thermotolerans : YM 46 YJ c YJ 58 R0 R0 YJ c 52 YJ 56 YJ R0 R0 YJ 51 YJ L0 YM L0 51 w YJ R0 52 w YM L0 46 w YM L0 49 w YJ R0 55 w YM 53 w X w YJ YJ R0 R0 57 55 w YJ YJ R0 R0 54 53 52 R0 YJ w Gene duplication/loss w w Gene duplication/loss w L0 YM 48 L0 w YM L0 YJ R0 YJ 56 c R0 Gene duplication/loss w 57 R0 YJ YJ R0 R0 55 54 w w w YJ YJ YJ R0 R0 52 53 w w YJ YJ R0 R0 55 57 w w 54 R0 R0 YJ YJ YJ R0 52 53 w w S. cerevisiae X YM L0 YM 46 w L0 YM 48 L0 w YM 49 w L0 YJ 51 R0 w YJ 56 c R0 YJ 58 c R0 YJ 56 c R0 47 w L0 YM YJ YJ R0 R0 55 57 w w 54 R0 R0 YJ YJ YJ R0 52 53 w w c RECIPROCAL GENE LOSS XIII YM L0 YM 46 w L0 YM 48 w L0 YM 49 w L0 YJ 51 w R0 YJ 56 c R0 58 YM c L0 YM 46 w L0 YM 48 w L0 YM 49 w L0 51 w 7 Double Synteny and Whole Genome Duplication in S. cerevisiae WGD segmental duplications <gene tandem duplications DUPLICATION New functions Gene dosage Gene order changes and translocations LOSS -> sequence degeneration deletion Pseudogenes and gene relics Speciation Dietrich et al., 2004 Double Synteny and Whole Genome Duplication in Tetraodon Double Synteny and Whole Genome Duplication in Tetraodon 110 Doubly Conserved Synteny Blocks Jaillon et al., 2004 Jaillon et al., 2004 8 Double Synteny and Whole Genome Duplication in Tetraodon Double Synteny and Whole Genome Duplication in S. cerevisiae # genes Whole Genome Duplication Jaillon et al., 2004 Wapinski et al., 2007 9