
07/02/2011
1
Un aperçu de la
comparaison de structures
d’ARN
Alain Denise
Cours ABA 2010-2011
M2 Bioinformatique et Biostatistiques
« Bio-Algorithmique » de l’ARN
•Prédiction de structure en fonction de la
séquence
• Détermination d’une séquence en fonction de
la structure
•Détection de motifs structurels dans une
séquence ou dans une structure
•Comparaison de deux ou plusieurs structures
•Recherche de sous-structures communes à
deux ou plusieurs structures
Préliminaire :
-distance d’ édition de deux
séquences
- programmation dynamique
Distance d’édition de 2 séquences
Deux séquences v = v1v2…vnet w = w1w2…wm
Opérations d’édition :
•ins(x,i)
•suppr(x,i)
•subs(x,y,i)
CHAT - suppr(C,1) HAT - subs(H,R,1) RAT
•Chaque modification a un poids, dépendant de
l’opération et des lettres en cause.
• Distance d’édition entre v et w : poids minimal
d’une suite d’opérations permettant de transformer v
en w.
CHAT - suppr(C,1) HAT - subs(H,R,1) RAT
Distance d’édition de 2 séquences
v = v1v2…vn w = w1w2…wm
s(x,y) : score de substitution de x en y
s(x,-) : score de suppression de x
s(-,y) : score d’insertion de y
D(v,w) : distance d’édition de v et w
Needleman, Wunsch 1970, Gotoh 1982
D(v1…vi,w1…wj) = Min {
D(v1…vi-1,w1…wj-1) + s(vi,wj)
D(v1…vi-1,w1…wj) + s(vi,-)
D(v1…vi,w1…wj-1) + s(-,wj)
}
Distance d’édition de 2 séquences