Etude de l'évolution et de la structure des génomes des vertébrés Plan Introduction Évolution et structure des génomes Première étape: Comparaison des génomes Processus Automatisation (CASSIOPE) Un exemple: La région du CMH Hypothèse Résultats Une premier pas vers la reconstruction Futur But: Etude de l'évolution et de la structure du génome des vertébrés Reconstruire l’histoire des génomes Mettre en évidence les différents événements chromosomiques (Polyploïdisation / Duplication « en bloc » - Remaniements chromosomiques: inversion, translocation, ...) Reconstruire les génomes ancestraux et actuels non séquencés Comparaison de génomes Reconstruction => Première étape indispensable Comparer Comparaison de génomes Reconstruction => Première étape indispensable Comparer Rechercher les régions conservées Conservation par descendance Conservation par convergence Utiliser le plus grand nombre de génomes possible Recherche de régions conservées • • • • • • 1 région de départ Recherche des orthologues Localisation de ces orthologues « Clusterisation » Test statistique pour la conservation « Retour » sur la région conservée trouvée Recherche de régions conservées Grand nombre de données à manipuler => Automatisation: développement d'un outil informatique CASSIOPE (Clever Agent System Inheritance and Other Phenomena in Evolution) Data from Web databases C.A.S.S.I.O.P.E Clever Agent System for Synteny Inheritance and Other Phenomena in Evolution Ensembl by ENSJ API Sequences + Localizatio n+ QTL, ... NCBI by Entrez Utilities RMI OMIM diseases ACL/SL JADE multi-agents framework ACL/SL ACL/SL Orthologs Detection PhyloGenomics Ontology ACL/SL Expert System ACL/SL Ontology Persistance BEAN generator plugin Protégé OWL GUI JENA library API POSTGRESQL RDBMS Questions in SL language Agent Ensembl Recherche le contenu en génes FIGENIX Agent Ensembl Recherche le contenu en génes FIGENIX Agent Ensembl Recherche le contenu en génes Ensembl Localisation FIGENIX Agent Ensembl Recherche le contenu en génes Ensembl Localisation FIGENIX Agent Ensembl Recherche le contenu en génes Ensembl Localisation Même espèce Même chromosome Nbre gènes ≥ 3 < 300 000 pbs FIGENIX Agent Ensembl Recherche le contenu en gènes Test statistique Agent Ensembl Recherche le contenu en gènes Ensembl Localisation Même espèce Même chromosome Nbre gènes 3 < 300 000 pbs Si score 0.001 Région très conservée Si 0.05 score 0.001 Région conservée Si score 0.001 Région non conservée ############################################################# Value P: 2.499553651133726E-4 Value K: 1.0 Value N: 19 ################ synteny higthly conserved ################## Tree of life: cassiope1 score: 1.0653464368903798E-5 %%%%%%%%%%%%%%%%%%%%%%%%%% Question %%%%%%%%%%%%%%%%%%%%%%%%% UID Cluster: a20892:10412f43264:-7fcb Species: Name: HOMO~SAPIENS TaxeId: 9606 Genes list: >lcl|ENSG00000126878 |9606|HOMO~SAPIENS|C9orf58| >lcl|ENSG00000197355 |9606|HOMO~SAPIENS|NP_997192.1 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% ortholog number: 3 UID Cluster: a20892:10412f43264:-5614 Species: Name: TETRAODON~NIGROVIRIDIS TaxeId: 99883 Location: Chromosome: 4 Genes list: 7 %%%%%Gene: a20892:10412f43264:-7916 Ortholog: TRUE Reference: Identifier: GSTENG00014392001 Source URI: http://ensembldb.ensembl.org Name: GSTENG00014392001 Location: Chromosome: 4 Band: Start: 3111322 End: 3142151 Strand: -1 Protein: Header: >lcl|GSTENG00014392001 |99883|TETRAODON~NIGROVIRIDIS|_ Data: ENPYLCSDECDASNPDLAHPPQLMQDRERNGLITYWQTVTWRRHPEPLLA Synteny Vista Utilisation de CASSIOPE sur une région spécifique 2 tours de polyploïdisation chez le génome des vertébrés Analyse d’une région : les régions de paralogie du CMH Existe-t-il pour une région donnée chez Amphioxius, 4 régions de paralogie chez les vertébrés ? ? ? ? ? ? ? ? évènement de duplication évènement de spéciation Matériel et Méthode Génomes séquencés des vertébrés: H. sapiens (homme), C. Familiaris (chien), G. Gallus (poulet) , T. Nigroviridis (poisson ballon) Région amphioxius choisie correspondant aux 4 régions de paralogie du CMH de H. sapiens CASSIOPE Région conservée 4 régions de paralogie existantes chez différents vertébrés Région conservée 4 régions de paralogie conservées chez les différents vertébrés Région chromosome 9 H. sapiens région chromosome 17 G. gallus : région du chromosome 9 C. familiaris Région chromosome 6 H. sapiens région chromosome 16 G. gallus région du chromosome 12 C. familiaris Région chromosome 1 H. sapiens région chromosome 8 G. gallus région du chromosome 6 C. familiaris Région chromosome 19 H. sapiens région chromosome 28 G. gallus : Région chromosome 20 C. familiaris Duplication confirmée Il existe pour une région donnée chez Amphioxius, 4 régions de paralogie chez les vertébrés évènement de duplication évènement de spéciation Vers la reconstruction des génomes ancestraux Reconstruction des génomes ancestraux Reconstruction des génomes ancestraux Reconstruction des génomes ancestraux Utiliser CASSIOPE sur les génomes en entier Utiliser des nouveaux génomes informatifs Définitions des concepts biologiques pour la reconstruction Modélisation mathématique (collaboration avec E. Pardoux et S. Grusea) Maximum de vraisemblance Création d'algorithmes Automatisation => CASSIOPE Prédiction des génomes actuels Évaluer la qualité des algorithmes Ancêtre Ancêtre H. sapeins S. scrofa G. gallus T. nigroviridis Génome reconstruit Génome séquencé Laboratoire Evolution Biologique www.up.univ-mrs.fr/evol Virginie Lopez Rascol [email protected] Pierre Pontarotti Phillipe Gouret Etienne G.J. Danchin LATP Simona Grusea Etienne Pardoux Retombées directes au niveau bio médical Recherche des gènes impliqués dans des QTL ou maladies génétiques Mh1 Mp1 Mp1 Mc1 Mh2 Reconstruction de la région chez l' espèce p par CASSIOPE QTL? Mg1 Mp2 Espèce p non séquencée Espèces séquencées Mg2 Mp2 Mc2 + informations fonctionnelles (GO) Relations entre la fonction putative des gènes de la région et le phénotype Détermination des gènes candidats Tests expérimentaux