Intervalles communs de séquence pour l'inférence des homologues
positionnels.
Que ce soit en phylogénétique ou en génomique comparée, la comparaison
d'espèces nécessite souvent la donnée de gènes comparables (idéalement
orthologues) dans chaque espèce.
Si on ne s'intéresse qu'à des espèces qui ont tous leurs gènes en une et une
seule copie, tout va bien. La duplication d'un gène est hélas un phénomène
très fréquent. En présence de copies multiples, on doit d'abord établir un
couplage entre les copies qui proviennent d'un même évènement de
duplication.
La séquence des différentes copies présente généralement un taux de
similarité et il est coutume d'utiliser l'information sur la position des gènes
pour établir la correspondance. On nomme alors les couples de gènes des
homologues positionnels. Dans cet exposé je vais présenter un algorithme
glouton pour assigner les homologues positionnels et le comparer à d'autres
méthodes.