07/02/2011
1
Un aperçu de la
comparaison de structures
d’ARN
Alain Denise
Cours ABA 2010-2011
M2 Bioinformatique et Biostatistiques
« Bio-Algorithmique » de l’ARN
Prédiction de structure en fonction de la
séquence
Détermination d’une séquence en fonction de
la structure
Détection de motifs structurels dans une
séquence ou dans une structure
Comparaison de deux ou plusieurs structures
Recherche de sous-structures communes à
deux ou plusieurs structures
Préliminaire :
-distance d’ édition de deux
séquences
- programmation dynamique
Distance d’édition de 2 séquences
Deux séquences v = v1v2…vnet w = w1w2…wm
Opérations d’édition :
ins(x,i)
suppr(x,i)
subs(x,y,i)
CHAT - suppr(C,1) HAT - subs(H,R,1) RAT
Chaque modification a un poids, dépendant de
l’opération et des lettres en cause.
• Distance d’édition entre v et w : poids minimal
d’une suite d’opérations permettant de transformer v
en w.
CHAT - suppr(C,1) HAT - subs(H,R,1) RAT
Distance d’édition de 2 séquences
v = v1v2…vn w = w1w2…wm
s(x,y) : score de substitution de x en y
s(x,-) : score de suppression de x
s(-,y) : score d’insertion de y
D(v,w) : distance d’édition de v et w
Needleman, Wunsch 1970, Gotoh 1982
D(v1…vi,w1…wj) = Min {
D(v1…vi-1,w1…wj-1) + s(vi,wj)
D(v1…vi-1,w1…wj) + s(vi,-)
D(v1…vi,w1…wj-1) + s(-,wj)
}
Distance d’édition de 2 séquences
07/02/2011
2
v1v2… … … vn
w1
w2
… … … … … … …
… … … … … … …
wm
v1v2………vn
w1
w2
…………………
…………………
wm
s(v2,w1)
s(v2,-)
s(-,w1)
D(v1…vi,w1…wj) = Min { D(v1…vi-1,w1…wj-1) + s(vi,wj)
D(v1…vi-1,w1…wj) + s(vi,-)
D(v1…vi,w1…wj-1) + s(-,wj)
}
vi
vi-1
v1
wjs(vi,wj) s(vi,-)
s(-,wj)
wj-1
w1s(v1,w1) s(v1,-)
s(-,w1)
Comparaison de structures
d’ARN
07/02/2011 Projet Brasero - ANR Blanc 2006 11
A quel point ces structures sont-elles
similaires (ou différentes ?)
classification
phylogénie
Quelles parties des deux structures
se ressemblent le plus ?
La petite est-elle similaire à une
partie de la grande ?
Comparaison score + correspondance entre les structures
Pourquoi comparer des ARN ?
07/02/2011 Projet Brasero - ANR Blanc 2006 12
Comparer les séquences ne suffit pas
07/02/2011
3
Séquences arc-annotées
Séquences arc-annotées
Séquences arc-annotées
Séquences arc-annotées
Opérations d’édition
Opérations on bases:
Substitution: A C
Deletion / Insertion: A
Operations on arcs:
Arc-substitution: C G U A
Arc-deletion / Arc-insertion: C G
Arc-breaking / : C G C G
Arc-altering / : C G C -
Une édition de deux structures
07/02/2011
4
General Crossing Nested Plain
General NP-complete
Crossing NP-complete
Nested NP-
complete O(nm3)
Plain O(nm /
logn)
Jiang, Lin, Ma, Zhang 2002
Blin, Fertin, Rusu, Sinoquet 2003
Crochemore, Landau, Ziv-Ukelson 2002
Complexity of the edition problem
The « nested-nested » case
Secondary structures (without pseudokots)
Tree comparison
Structure 2aire arbre
Structure 2aire arbre
Structure 2aire arbre
Structure 2aire arbre
07/02/2011
5
Structure 2aire arbre
Structure 2aire arbre
Structure 2aire arbre
Structure 2aire arbre
Structure 2aire arbre
Différentes échelles de
représentation
1 / 15 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !