*Prédiction de la structure secondaire d!ARN
*Algorithme de Nussinov
*Minimisation de l!énergie libre
*Considération des pseudo-noeuds
*Identification de structures secondaires
*Grammaires hors-contextes
PLAN
1
ARN-repliement
IFT6291-BIN6000, H2006,
Sylvie Hamel
2
ARN-repliement
1) Pairage permis: Watson-Crick et Wobble
2) Chaque base ne peut appartenir qu!à une
seule paire de bases
3) Pas de “sharp turns”: au moins 3
bases par boucles
4) Pas de pseudo-noeuds:
IFT6291-BIN6000, H2006,
Sylvie Hamel
Structure secondaire:
Algorithme de Nussinov (1978)
3
IFT6291-BIN6000, H2006,
Sylvie Hamel ARN-repliement
Premier algorithme de programmation dynamique pour calculer le repliement
d!un séquence d!ARN qui maximise le nombre de paires de bases créées
© notes de cours d!Alessandra Carbone
Idée: il y a 4 façons pour calculer la meilleure structure du nucléotide i au
nucléotide j à partir de la meilleure sous-structure d!une séquence plus courte:
1. i et j forme une paire de base qu!on ajoute à la meilleure sous-structure pour la
séquence de i+1 à j-1
2. i est non apparié et on l!ajoute à la meilleure sous-structure pour la séquence de i+1 à j
3. j est non apparié et on l!ajoute à la meilleure sous-structure pour la séquence de i à j-1
4. combiner deux sous-structures optimales, l!une pour la séquence de i à k et l!autre pour
la séquence de k+1 à j
G G G A A A U C C
G
G
G
A
A
A
U
C
C
i
j
4
IFT6291-BIN6000, H2006,
Sylvie Hamel
Algorithme de Nussinov (suite)
ARN-repliement
Étant donné une séquence d!ARN, , on pose si
et sont appariés et , sinon
S=s1s2. . . sn
δ(i,j) = 1
si
sj
δ(i,j) = 0
L!algorithme calcule récursivement des scores qui représente le nombre
maximal de paires de bases qui peuvent être formées pour la sous-séquence
xi...xj
γ(i,j)
On va donc remplir une table de programmation dynamique n X n avec les
équations de récurrences suivantes:
Cas de base:
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
, pour i de 1à n
γ(i,i1) = 0
, pour i de 2à n
G G G A A A U C C
G
G
G
A
A
A
U
C
C
i
j
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0 0
0 0
0 0
0
1 1
1 1
0
1
5
IFT6291-BIN6000, H2006,
Sylvie Hamel
Algorithme de Nussinov (suite)
ARN-repliement
On va maintenant remplir la table diagonale par diagonale en se servant
des relations de récurrences suivantes:
γ(i,j) = max
γ(i+1,j)
γ(i,j1)
γ(i+1,j1) + δ(i,j)
max1<k<j[γ(i,k) + γ(k+1,j)]
0
0
0
0
0
1
0
0
0 0 1 23
0 1 2 3
1 2 2
1 1
1
G-C
G-C
A-U
A A
G
6
IFT6291-BIN6000, H2006,
Sylvie Hamel
Algorithme de “back-tracking”
ARN-repliement
Initialisation: Insérer (1,n) dans une pile (“push((1,n))”)
G G G A A A U C C
G
G
G
A
A
A
U
C
C
i
j
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0 0
0 0
0 0
0
1 1
1 1
0
0
0
0
0
0
1
0
0
0 0 1 23
0 1 2 3
1 2 2
1 1
1
G-C
G-C
A-U
A A
G
Considération thermodynamique:
7
ARN-repliement
Soit S une structure secondaire d!ARN et s1, s2, ... sk, l!ensemble de ces paires
de bases empilées et de ces boucles alors:
Hypothèse thermodynamique de
Tinoco-Uhlenbeck:
E(S) = e(s1) + e(s2) + ... + e(sk)
e(si) est estimée expérimentalement
IFT6291-BIN6000, H2006,
Sylvie Hamel
Caractéristiques générales de l!énergie libre:
8
ARN-repliement
e(s) est négatif si et seulement si s est une paire d!appariements (stacked pairs):
ce sont les seules cycles qui contribuent à la stabilité de la molécule.
IFT6291-BIN6000, H2006,
Sylvie Hamel
Un appariement (G-C) est + stable qu!un appariement (A-U)
Les zones externes non appariées ne font partie d!aucun cycle -> score nul
Si E(S) > 0, S ne peut être stable
Si s est une boucle interne de la forme
i G (i+2)
| |
j U (j-2)
alors e(s) = 0
i.e (G U) ne déstabilise pas la structure
Algorithme de Zuker (1981-1989)
9
ARN-repliement
IFT6291-BIN6000, H2006,
Sylvie Hamel
Une différence important avec l!algorithme de Nussinov est que l!énergie d!une paire
de bases est calculée en fonction de la paire de bases précédente (stacking)
Cette modification est plus appropriée mais elle complique de beaucoup l!algorithme
de programmation dynamique
Algorithme de Zuker (suite)
10
ARN-repliement
IFT6291-BIN6000, H2006,
Sylvie Hamel
© notes de cours de Nadia El-Mabrouk
1 / 9 100%