
Introduction
Contexte et problématique
Cette thèse s’inscrit dans le cadre bidisciplinaire de la bioinformatique et propose une alter-
native à la bioinformatique «classique», principalement orientée vers la biologie moléculaire,
pour aller vers une bioinformatique d’avant-garde, ou «systems biology», qui s’intéresse à
l’analyse et la simulation des comportements d’un système biologique contraint par son
environnement. La problématique est d’extraire, de manière automatique, les propriétés
émergentes d’un système dynamique, complexe par nature. Par exemple, cette biologie des
systèmes identifie le rôle d’un gène sur la croissance d’une cellule [BES11], ou le lien qui
existe entre le génome d’une bactérie et son métabolisme [BER11].
Parallèlement, la dernière décennie a vu l’émergence d’un nouveau domaine biologique
à l’interface de la génomique et de l’écologie : la génomique environnementale [RV04]. Un
défi majeur de ce domaine scientifique est l’élucidation, au niveau moléculaire, du fonc-
tionnement des communautés microbiennes dans leur environnement. Grâce aux récents
progrès biotechnologiques (i.e. séquençage massif de génomes et protéomique à haut débit),
il est possible aujourd’hui d’avoir une perception complète, voir hollistique, d’un écosys-
tème. Par exemple, les microbiologistes, grâce à ces nouvelles expériences, veulent com-
prendre pourquoi certaines nappes phréatiques se dénitrifient naturellement en présence
de communautés bactériennes, comment certaines communautés microbiennes produisent
du biocarburant à partir de polysaccharrides [WLW+12], comprendre la distribution des
micro-organismes marins en fonction des océans [KAB+11].
D’un point de vue informatique, répondre à ces questions revient à extraire les propriétés
émergentes d’un écosystème microbien modélisé, ouvrant un nouveau champ d’application
appelé «systems ecology» [KS11]. Comme en «systems biology», le rôle de l’informatique
est ici une fois de plus essentiel pour appuyer cette nouvelle thématique émergente, et ce
bien au-delà de ce qu’elle peut traditionnellement fournir (puissance de calcul, capacité de
stockage), notamment par ses capacités à formaliser et à extraire des informations avec
toutes leurs interdépendances et d’en inférer d’autres.
Problèmes et opportunités
Dans un écosystème, l’ensemble des individus et les populations d’individus interagissent
dans le temps et l’espace en fonction des fluctuations environnementales. Les interactions
forment des réseaux qui sont classiquement analysés de manière formelle par les écologues
(i.e. principalement par des systèmes d’équations différentielles ordinaires - ODEs). Ce-
pendant les approches traditionnelles écologiques sont rapidement limitées par le manque
d’information cinétique concernant les interactions entre individus.
Pour pallier à ce sous paramétrage, nous proposons de modéliser le problèmevia les
transformations de matière issue des interactions entre bactéries. En effet, chaque bactérie
produit des composés, les métabolites, qui sont consommés par d’autres bactéries. Ces
métabolites sont donc convertis par diverses réactions biochimiques, produisant un réseau.
3