P R E A M BU L E
Notre travail a été effectué au laboratoire TIMC -Imag
sous la direction d’Oliver François et a concerné l’étude
d’une méthode de clustering implémentée par le logiciel
STRUCTURE.
Lorsque l’on s’intéresse à l’évolutio n du patrimoine
génétique d’une espèce, la population est souvent prise
comme unité de base et il est utile de pouvoir répartir les
individus d’un échantillon au sein de populations.
Plusieurs approches sont alors envisag eables : on peut
chercher à grouper les individus d’un échantillon en
différentes populations ou chercher, à partir de la
connaissance d’un certain nombre de populations, la
provenance d’un individu d’origine inconnue.
Nous nous intéresserons ici à la première approche et à
la méthode dite de « clustering » ayant pour but de grouper
des individus en populations sur la base de leur génotype.
Un logiciel, largement utilisé en génétique des populations,
se propose d’implémenter cette méthode, le logiciel
STRUCTURE.
Notre travail consistera en l’étude de ce logiciel et des
algorithmes utilisés par celui-ci afin de déterminer la
portée et les limitations de ceux-ci. Pour cela, nous
procèderons de la sorte : nous utiliserons un logiciel
per mettant de générer des jeux de données génétiques à
partir de modèles prédéfinis, le logiciel MS. Nous ferons
traiter les données générées par ce logiciel par
STRUCTURE puis nous comparerons le résultat obtenu
avec celui attendu.
Nous commencerons par présenter les différentes
notions de génétique des populations qui seront utilisées
au cours de nos travaux futurs avant de présenter les
expériences réalisées avec les logiciels MS et STRUCTURE
avant de conclure quant à l’efficacité de la méthode de
« clustering » implémentée par le logiciel STRUCTURE.
Population :
ensemble
d'individus d'une
même espèce
vivante se
perpétuant dans
un territoire donné