Filtrage à l’aide de graines pour
l’alignement local
Laurent Noé
http://www.loria.fr/~noe
Université Henri Poincaré
Travail commun avec Gregory Kucherov
Plan
Introduction : alignement local
Définition
Méthodes exactes
Techniques de filtrage
Définition d’un filtre
Exemples de filtres
Méthodes heuristiques pour l’alignement local
Définition d’une graine (ancres)
Méthodes successivement développées
BLAST-GAPPEDBLAST-BLAT-PATTERNHUNTER-YASS
Graines-espacées
Design des graines espacées
Waiting Time
Algorithme de Keich
Algorithme de Bulher
Alignements homogènes
Alignement Local
Alignement
« Processus par lequel deux séquences sont comparées afin
d'obtenir le plus de correspondances (identités ou substitutions
conservatives) possibles entre les lettres qui les composent. »
http://www.infobiogen.fr
Alignement Local
« Alignement des deux séquences seulement sur une portion de
leur longueur. » http://www.infobiogen.fr
Deux sous-chaînes sont alignées.
Exemple
GCAACATAG
|||||||||
GCAACATAG
TACATGCG
||:|||||
TAGATGCG
TGTGC-TTG
||||| |||
TGTGCCTTG
S1: TGTGCTTGGCAACATAGATAGATGCG
S2: TACATGCGCAACATAGCTGTGCCTTG
S1: TGTGCTTGGCAACATAGATAGATGCG
S2: TACATGCGCAACATAGCTGTGCCTTG
S1: TGTGCTTGGCAACATAGATAGATGCG
S2: TACATGCGCAACATAGCTGTGCCTTG
S1: TGTGCTTGGCAACATAGATAGATGCG
S2: TACATGCGCAACATAGCTGTGCCTTG
Qualité d’un alignement
Méthodes d’évaluation
Pourcentage d’identité
distance d’édition
longueur du fragment
Score d’un alignement
Fixer un score pour chacune des opérations unitaires lors de la
construction d’un alignement
correspondance/substitution de deux nucléotides
insertion/suppression de deux nucléotides
Pour un alignement donné, la somme des scores des opérations
unitaires associées donne le score de l’alignement
Exemple
Alignement fixé
Fonction de score
Matrice de score
s(a,b)
Coût pour l’insertion/la suppression de nucléotides (indels)
g = « s(a,-) »
g = -3
Score de l’alignement
1*(8 matches) 1* (1 transition) 2* (1 transversion ) 3* (1 indel)= 2
ATGTGC-TTGC
|||:|| |.||
ATGAGCCTCGC
A T G C
A1 -2 -1 -2
T-2 1 -2 -1
G-1 -2 1 -2
C-2 -1 -2 1
1 / 55 100%