Des algorithmes efficaces pour la détection de transferts horizontaux de
gènes : cas de transferts complet et partiel
Le processus d’évolution d’espèces a longtemps été modélisé à l’aide d’arbres
phylogénétiques. Dans de tels arbres, chaque espèce ne peut être liée qu’avec son ancêtre
le plus proche, alors que toute autre relation inter-espèces, telle que par exemple le
transfert horizontal de gènes (i.e. transfert latéral de gènes), n’est pas permise.
Cependant, ce dernier joue un rôle clé dans l’évolution des espèces, en particulier des
bactéries. De nombreux projets de séquençages de bactéries ont renforcé l’idée que
l’analyse phylogénétique d’un groupe d’espèces doit tenir compte d’évènements évolutifs
tels que la convergence, la duplication, la perte et le transfert horizontal de gènes.
Nous présenterons deux algorithmes polynomiaux permettant la prédiction des transferts
horizontaux survenus durant l’évolution d’un groupe d’organismes considérés. Le
premier algorithme, fonctionnant dans le cadre du modèle de transfert complet d’un gène,
procède par l’établissement des différences topologiques entre l’arbre phylogénétique
d’espèces et celui du gène en question. Il utilise une procédure d’optimisation basée soit
sur un critère métrique (i.e. les moindres carrés) soit sur un critère topologique (i.e. la
distance topologique de Robinson et Foulds) pour tester la possibilité d’un transfert de
gène entre tous les couples de branches de l’arbre d’espèces. Nous ferons la comparaison
de notre algorithme, fonctionnant en temps polynomial, avec un algorithme exact de
Hallett et Lagergren (2001) qui nécessite un temps exponentiel en fonction du nombre de
transferts.
Nous présenterons par la suite des principales étapes de notre second algorithme servant à
détecter des transferts horizontaux partiels. Le dernier modèle suppose qu’une partie
quelconque d’un gène donné peut être transférée entre les lignées d’un arbre
phylogénétique.
Finalement, nous montrerons comment l’algorithme pour la prédiction des transferts
complets permet de prédire d’éventuels transferts du gène rubisco rcbL dans une
phylogénie incluant des algues, des cyanobactéries et des protéobactéries.