Etude de l`évolution de l`ordre des gènes de vertébrés par simulation

Etude de l’´evolution de l’ordre des g`enes de vert´ebr´es
par simulation
Joseph Lucas
To cite this version:
Joseph Lucas. Etude de l’´evolution de l’ordre des g`enes de vert´ebr´es par simulation.
G´enomique, Transcriptomique et Prot´eomique [q-bio.GN]. Universit´e Pierre et Marie Curie
- Paris VI, 2016. Fran¸cais. <NNT : 2016PA066140>.<tel-01398369>
HAL Id: tel-01398369
https://tel.archives-ouvertes.fr/tel-01398369
Submitted on 17 Nov 2016
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of sci-
entific research documents, whether they are pub-
lished or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.
Université Pierre et Marie Curie
École Doctorale 515 Complexité du Vivant
Institut de Biologie de l’École Normale Supérieure de Paris
Génomique Fonctionnelle
Dynamique et Organisation des Génomes
Étude de l’évolution de l’ordre des
gènes de vertébrés par simulation
présentée par Joseph Lucas
Thèse de doctorat en Biologie
pour une soutenance le 17 mai
Sous la direction de : MrHugues Roest Crollius
Directeur de recherche
Rapporteurs : MrDavid Sankoff
Professeur des universités
MrNicolas Lartillot
Directeur de recherche
Membres du jury : Mme Alessandra Carbone
Professeur des universités
Mme Sèverine Bérard
Maître de conférences
Mme Claire Lemaitre
Chargée de recherche
Résumé
Durant les millions d’années qu’ont duré leurs évolutions, les génomes ont subi de nombreux
réarrangements chromosomiques. Les plus fréquents sont les inversions, les translocations
réciproques, les fissions et les fusions de chromosomes. Pour étudier ces évènements nous
avons premièrement développé une méthode, Phyldiag, qui, à partir de l’ordre des gènes
dans les génomes modernes, identifie les segments de chromosomes qui ont été conservés
sans être cassé par les réarrangements. Cette méthode tolère des gènes dupliqués, des
clusters de duplications, des erreurs d’annotation, des duplications segmentales et elle
identifie également les nombreux segments courts y compris ceux composés d’un gène
unique. Dans un deuxième temps nous avons développé Magsimus, un simulateur réaliste
qui fait évoluer in silico un génome ancestral artificiel en lui faisant subir des réarrangements
chromosomiques ainsi que des évènements géniques : des duplications, des naissances de
novo et des délétions de gènes. Avec ce simulateur nous avons tenté de reproduire des
évolutions équivalentes à l’évolution réelle qui, à partir d’un ancêtre commun vivant il y
a environ 325 million d’années, a abouti à l’humain, la souris, le chien, l’opossum et le
poulet. Nous avons utilisé les segments conservés entre les espèces réelles pour calculer
une première estimation des nombres de réarrangements le long des branches de l’arbre
des espèces. En comparant les génomes modernes simulés aux génomes modernes réels
nous avons quantifié le réalisme de ce paramétrage initial puis nous l’avons affiné par une
procédure d’optimisation, ce qui nous a simultanément permis d’estimer une distribution
des tailles des inversions. Enfin nous montrons avec un exemple simple qu’il sera nécessaire
de forcer la réutilisation de points de cassures pour améliorer le simulateur.
Abstract
In the course of evolution genomes have been restructured by massive chromosomal rear-
rangements. The most common rearrangments are inversions, reciprocal translocations,
fissions and fusions of chromosomes. To study these events we first developed a tool,
PhylDiag, that uses the conservation of gene order in extant genomes to uncover chromo-
somal segments that remained unbroken from rearrangements. This tool deals with gene
duplications, clusters of duplications, annotation errors, segmental duplications and is
able to identify small segments, even those that contain a unique gene. Subsequently, we
developed Magsimus, a realistic simulator that evolves in silico an artificial genome through
chromosomal rearrangments and genic events – gene duplications, de novo gene births and
gene deletions. With this simulator we made an attempt to reproduce evolutions analogous
to the real evolution that happened from a common ancestor, that lived 325 million
years ago, to the human, the mouse, the dog, the opossum and the chicken. Conserved
segments between these species were used to infer a first estimation of the number of
rearrangements that occurred along the branches of the species tree. The realism of this
initial parameterisation has been quantified by comparing our simulated extant genomes
to the real ones. We then used an optimisation process to correct our estimation while we
also estimated the shape of a probabilistic distribution of the lengths of inverted segments.
At last, with a simple example, we describe why it will be necessary to enforce breakpoints
reuses if we want to improve our simulator.
À mon père
ainsi qu’à toute ma chaleureuse famille,
Remerciements
Je remercie les rapporteurs, M
r
David Sankoff et M
r
Nicolas Lartillot, les
examinateurs, M
me
Alessandra Carbone, M
me
Sèverine Bérard et M
me
Claire
Lemaitre d’avoir accepté d’être membres de mon jury. Je les remercie égale-
ment de lire cette thèse malgré sa longueur. Je remercie plus particulièrement
M
r
David Sankoff de venir de si loin pour la soutenance. Enfin, je remercie
Mme Alessandra Carbone d’avoir accepté d’être présidente du jury.
Hugues, merci pour ces 4 années de thèse lors desquelles tu m’as poussé à
bout! Dans le bon sens du terme, tu as réussi à quotidiennement entretenir
mon désir d’avoir de meilleurs résultats, plus vite et à toujours les expliquer
plus clairement et plus pédagogiquement. La culture encyclopédique et
l’esthétique british, la rigueur chaleureuse et l’humilité avec lesquels tu as
animé les travaux sur lesquels nous avons coopéré m’ont profondément inspiré.
J’espère que par rapport aux objectifs initiaux, les résultats de mon travail
sont à la hauteur de la confiance avec laquelle tu m’as accueilli dans l’équipe.
J’aurais aimé faire tellement plus et plus vite. Merci enfin pour tes relectures
et tes nombreuses corrections salvatrices qui font de ce travail, plus qu’un
travail personnel, une œuvre collective.
Alexandra, merci pour ton talent féminin au sujet des problématiques
relationnelles. Merci d’avoir été là dans les moments d’allégresses ainsi que
dans des moments plus difficiles. Merci Yves, pour ton énergie contagieuse,
merci Christine pour nos déjeuners à cœurs ouverts, Lambert pour ta douceur
et les gâteaux de ta mère, Leila pour ton accueil, Lilian pour tes bonbons
malaisiens, Céline pour les parties de poker chez toi, Camille pour la précision
de tes explications, Magali pour l’intérêt que tu portes au sens commun. Plus
particulièrement, je vous remercie Nga, pour ton apport concernant le code
de PhylDiag, et Lucas, « über-stagiaire », sans toi la paramétrisation de
MagSimus aurait été impossible. Ce fut une grande chance de collaborer avec
vous deux. Merci enfin, Matthieu, pour toutes tes fonctions informatiques
bien utiles.
Je souhaite également remercier tous les « cousins » des autres familles
de l’institut, notamment l’équipe de Denis, et l’équipe des bioinformaticiens.
Merci Morgane et Denis d’insuffler toute la joie de vivre énergique dont
l’activité scientifique a tant besoin pour s’animer. Merci Samuel, Pauline et
tous les étudiants mexicains pour les nombreuses discussions le midi dans la
salle de réunion. Merci aux autres équipes qui animent l’institut et qui con-
courent à le faire rayonner à l’international. Merci Bertrand pour l’initiation
au jazz ainsi que pour les nombreux scientifiques que tu m’as fait rencontrer.
1 / 204 100%

Etude de l`évolution de l`ordre des gènes de vertébrés par simulation

La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !