Résumé
Durant les millions d’années qu’ont duré leurs évolutions, les génomes ont subi de nombreux
réarrangements chromosomiques. Les plus fréquents sont les inversions, les translocations
réciproques, les fissions et les fusions de chromosomes. Pour étudier ces évènements nous
avons premièrement développé une méthode, Phyldiag, qui, à partir de l’ordre des gènes
dans les génomes modernes, identifie les segments de chromosomes qui ont été conservés
sans être cassé par les réarrangements. Cette méthode tolère des gènes dupliqués, des
clusters de duplications, des erreurs d’annotation, des duplications segmentales et elle
identifie également les nombreux segments courts y compris ceux composés d’un gène
unique. Dans un deuxième temps nous avons développé Magsimus, un simulateur réaliste
qui fait évoluer in silico un génome ancestral artificiel en lui faisant subir des réarrangements
chromosomiques ainsi que des évènements géniques : des duplications, des naissances de
novo et des délétions de gènes. Avec ce simulateur nous avons tenté de reproduire des
évolutions équivalentes à l’évolution réelle qui, à partir d’un ancêtre commun vivant il y
a environ 325 million d’années, a abouti à l’humain, la souris, le chien, l’opossum et le
poulet. Nous avons utilisé les segments conservés entre les espèces réelles pour calculer
une première estimation des nombres de réarrangements le long des branches de l’arbre
des espèces. En comparant les génomes modernes simulés aux génomes modernes réels
nous avons quantifié le réalisme de ce paramétrage initial puis nous l’avons affiné par une
procédure d’optimisation, ce qui nous a simultanément permis d’estimer une distribution
des tailles des inversions. Enfin nous montrons avec un exemple simple qu’il sera nécessaire
de forcer la réutilisation de points de cassures pour améliorer le simulateur.
Abstract
In the course of evolution genomes have been restructured by massive chromosomal rear-
rangements. The most common rearrangments are inversions, reciprocal translocations,
fissions and fusions of chromosomes. To study these events we first developed a tool,
PhylDiag, that uses the conservation of gene order in extant genomes to uncover chromo-
somal segments that remained unbroken from rearrangements. This tool deals with gene
duplications, clusters of duplications, annotation errors, segmental duplications and is
able to identify small segments, even those that contain a unique gene. Subsequently, we
developed Magsimus, a realistic simulator that evolves in silico an artificial genome through
chromosomal rearrangments and genic events – gene duplications, de novo gene births and
gene deletions. With this simulator we made an attempt to reproduce evolutions analogous
to the real evolution that happened from a common ancestor, that lived 325 million
years ago, to the human, the mouse, the dog, the opossum and the chicken. Conserved
segments between these species were used to infer a first estimation of the number of
rearrangements that occurred along the branches of the species tree. The realism of this
initial parameterisation has been quantified by comparing our simulated extant genomes
to the real ones. We then used an optimisation process to correct our estimation while we
also estimated the shape of a probabilistic distribution of the lengths of inverted segments.
At last, with a simple example, we describe why it will be necessary to enforce breakpoints
reuses if we want to improve our simulator.