
Algorithmique et bioinformatique
Introduction
Alignement de deux séquences
Alignement d'une séquence sur une
base de données
Alignement multiple
Phylogénie
Phylogénie : méthode de
Parsimonie
Calculs de la distance entre deux
séquences
Méthodes de distances
Notes sur l'implémentation des
algorithmes de reconstruction
phylogénétique
Maximum de vraissembalnce et
phylogénie
Simulation de Monte-Carlo à l'aide
de chaines de Markov (MCMC)
Recherche de mot dans un texte
Recherche de mot dans un texte :
indexation d'un texte
Chaines de Markov cachées
Strucure secondaire de l'ARN et
grammaires stochastiques (SCFG)
Bibliographie (livres)
Introduction
Dans ce document, nous présentons les principaux algorithmes utilisés en
bioinformatique : il s'agit surtout des manipulations de séquences (comparaison (ou
alignement) de deux séquences, comparaison d'une famille de séquences), de
reconstruction phylogénétique (construction d'un arbre qui décrive le mieux les
données dont on dispose), de manipulation de chaines de caractères (recherche dans
un texte) ou de texte (indexation d'un texte ou d'un génome). Au cours de notre
voyage dans le domaine de la bioinformatique, nous constaterons que la notion de
graphe est omniprésente (arbres phylogénétiques, chaines de Markov, automates
probabilistes, chaines de Markov cachées, SCFG, etc.) ; nous découvrirons aussi un
peu de statistiques (tests statistiques, p-valeur, estimateur du maximum de
vraissemblance, méthodes bayesiennes, simulation de Monte-Carlo à l'aide de chaines
de Markov, etc.)
(Il manque quelques illustrations -- je ne suis pas vraiment doué en dessin --, mais
j'espère que c'est quand-même compréhensible.)
(Il y a aussi quelques passages qui mériteraient d'être (ré)écrits (en particulier celui
sur les E-valeurs) -- mais comme les journées n'ont que 24 heures, ils resteront
comme ça.)