D´
EPARTEMENT D’INFORMATIQUE ET DE RECHERCHE OP´
ERATIONNELLE
SIGLE DU COURS : IFT 3295 / IFT 6291 / BIN6000 (Aut2014)
NOM DU PROFESSEUR : Nadia El-Mabrouk
TITRE DU COURS : Bio-Informatique
EXAMEN INTRA
Date : Mardi 14 Octobre 2014
Heure : 13h30 - 15h20
Salle : 1177 Pav A.AISENSTADT
DIRECTIVES P´
EDAGOGIQUES :
Aucune documentation n’est permise.
Inscrivez tout de suite votre nom et code permanent en bas de cette page.
R´epondez sur le questionnaire en utilisant l’espace libre qui suit chaque question.
Lisez attentivement toutes les questions avant de commencer.
Les exercices sont ind´ependants les uns des autres.
1. /14
2. /6
3. /25
4. /30
5. /25
Total : /100
Nom : Code permanent :
R`eglement sur le plagiat : (extrait du r`eglement disciplinaire sur le plagiat de l’Universit´e de Montr´eal).
Constitue un plagiat :
1. Faire ex´ecuter son travail par un autre ;
2. Utiliser, sans le mentionner, le travail d’autrui ;
3. ´
Echanger des informations lors d’un examen ;
4. Falsifier des documents.
Le plagiat est passible de sanctions allant jusqu’`a l’exclusion du programme.
1
Exercice 1 : (14 points)
Pour chacun des ´enonc´es suivants indiquer s’il est vrai ou non en encerclant OUI ou NON.
1. Soient Set Tdeux s´equences et Dla matrice m×ntelle que pour tous
1im, 1jn,D(i, j) est la distance d’´edition entre S[1, i] et T[1, j].
Alors la valeur d’une case de Dest toujours sup´erieure ou ´egale `a la valeur de
la case pr´ec´edente sur la ligne et sur la colonne et sur la diagonale.
OUI NON
2. La complexit´e en temps de l’alignement local est la mˆeme que celle de l’ali-
gnement global.
OUI NON
3. Le score SP d’un alignement Aconsistant avec un arbre guide Test ´egal au
score de l’arbre T(i.e. somme des scores des arˆetes, o`u le score d’une arˆete v
est la distance d’´edition entre les deux s´equences reli´ees par v).
OUI NON
4. La sensibilit´e d’un algorithme de filtrage diminue (i.e. plus de faux-n´egatifs)
lorsqu’on augmente la taille kdes graines (seeds) recherch´ees au cours de la
phase de recherche exacte.
OUI NON
5. Un alignement multiple consistant avec l’arbre ´etoile a un score SP qui est
toujours deux fois sup´erieur au score SP d’un alignement multiple optimal.
OUI NON
6. Soit Aun alignement multiple de score SP minimal pour un ensemble {Si,1
im}de s´equences. Alors le score induit pour deux s´equences Si, Sjquel-
conques de cet ensemble est sup´erieur ou ´egal `a la distance d’´edition D(Si, Sj).
OUI NON
7. La notion d’alignement local n’a de sens que dans le cas d’une mesure de
similarit´e incluant des scores n´egatifs.
OUI NON
Exercice 2 : Questions diverses (6 points)
Justifier votre r´eponse pour un parmi les 7 ´enonc´es de l’exercice pr´ec´edent.
Justification de l’´enonc´e num´ero :
2
Exercice 3 : Recherche exacte (25 points)
Soit Σ un alphabet de taille |Σ|,Tun texte de taille net Pun mot de taille m. Il est sous entendu
que nest beaucoup plus grand que m. Le probl`eme est de rechercher toutes les occurrences exactes
de Pdans T.
1. (a) Quelle est la complexit´e en temps, dans le pire des cas, de l’algorithme na¨ıf ?
(b) Donner un exemple (Tet P) du pire des cas pour l’algorithme na¨ıf, pour net mfix´es (par
exemple n= 8 et m= 4).
(c) Quelle est la complexit´e en temps, dans le meilleur des cas, de l’algorithme na¨ıf ?
(d) Donner un exemple (Tet P) du meilleur des cas pour l’algorithme na¨ıf.
2. Pour optimiser l’algorithme na¨ıf, il s’agit de d´ecaler le mot Pde plus d’un caract`ere `a la fois. En
particulier, si jest la position dans Ttelle que T[j] est align´e avec P[m] (voir figure ci-dessous),
l’algorithme de Horspool consid`ere le plus petit d´ecalage dpermettant (si possible) d’avoir un
“match” entre le caract`ere T[j] du texte et un caract`ere de P.
T:
P:
j+2
j+1
j
a
m
m
a
a
d
3
(a) Quelle est la complexit´e dans le pire des cas de l’algorithme de Horspool ?
(b) Donner un exemple (Tet P) du pire des cas pour l’algorithme de Horspool.
(c) Quelle est la complexit´e dans le meilleur des cas de l’algorithme de Horspool ?
(d) Donner un exemple (Tet P) du meilleur des cas pour l’algorithme de Horspool.
(e) Dans le cas de l’algorithme de Sunday, le d´ecalage est effectu´e en fonction du caract`ere j+1
du texte. Il n’est cependant pas possible d’effectuer le d´ecalage en fonction du caract`ere
j+ 2 du texte. Quel serait le probl`eme dans ce cas ? Donner un exemple qui illustre le
probl`eme.
4
Exercice 4 : Alignement de s´equences (30 points)
1. Dans cette question la valeur de similarit´e d’un alignement est calcul´ee en attribuant le score de
2pour un “match” (alignement de deux caract`eres identiques), et le score de 1pour une
erreur, c’est-`a-dire pour l’alignement de deux caract`eres diff´erents (mismatch), ou l’alignement
d’un nucl´eotide avec un caract`ere vide (indel). Nous nous int´eressons `a l’alignement global
entre deux s´equences ude taille met vde taille n.
(a) Expliciter les conditions initiales et ´ecrire la relation de r´ecurrence permettant de calculer
la valeur maximale V(i, j) d’un alignement global entre le pr´efixe u[1, i] de taille ide uet
le pr´efixe v[1, j] de taille jde v, pour tous 1 imet 1 jn. Expliquer comment
retrouver dans la table de programmation dynamique la valeur maximale d’un alignement
global entre les deux s´equences, ainsi qu’un alignement donnant lieu `a cette valeur.
(b) Remplir la table de programmation dynamique suivante dans l’objectif de trouver un ali-
gnement global de score maximal entre u=CCAC et v=CT T T AC.Inclure les fl`eches
permettant de remonter dans la table.
V(i, j) C T T T A C
C
C
A
C
5
1 / 10 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !