Liste&d’exercices&3i019&
!
!
"#$%$&#'!($%)*+%,#-'!
!
! !
./ 0)1#2#33'4!*'!5+6'37!+2!&)2$('/!
8/ 9:;%#5+'-!%'3!<#11)-'2*'3!'27-'!%'3!($%)*+%'3!<6=0>!'7!<?=@>/!
A/ 9:;%#5+'-!%'!;-$*'33+3!<'!-);%#*,7#$2!<'!%6=0>/!
B/ 9:;%#5+'-!%'!;-$*'33+3!<'!7-,23*-#;7#$2!<'!%6=0>/!
C/ 9:;%#5+'-!%'!()*,2#3('!<'!;-$<+*7#$2!<'3!;-$7)#2'3/!
D/ E+'%3!3$27!%'3!<#11)-'273!7F;'3!<6=@>G!':;%#5+'-!%'+-3!-H%'3/!
I/ J+-!+2!K-#2!<6+2'!($%)*+%'!<6=0>G!%,!3)5+'2*'!<'3!2+*%)$7#<'3!'37!CCGTAC/!E+'%%'!'37!%,!
3)5+'2*'!<'3!2+*%)$7#<'3!5+#!36,33$*#'27!L!*'!K-#2!%$-3!<'!%,!-);%#*,7#$2!M!N$-3!<'!%,!
7-,23*-#;7#$2!M!
!
N'3!&O2'3!'7!%'+-3!1$2*7#$23!
!
!
./ E+6'37P*'!5+'!%6,22$7,7#$2!<'!&O2'3!M!!
8/ E+'%%'3!3$27!%'3!<#11)-'2*'3!'27-'!%'3!&O2'3!;-$*,-F$7'3!'7!'+*,-F$7'3!M!
A/ E+'%3!3$27!%'3!;-$K%O('3!-'2*$27-)3!;,-!%'3!$+7#%3!<6,22$7,7#$2!<'!&O2'3!<,23!%'3!&)2$('3!!
;-$*,-F$7'3!M!0,23!%'3!&)2$('3!'+*,-F$7'3!M!
B/ Q$#*#!+2!1-,&('27!<?=0>!*$27'2,27!%'!<)K+7!<'!%,!3)5+'2*'!*$<,27'!<6+2!&O2'!!
AATGAAACGCATTAGCACC…
TTACTTTGCGTAAGCGTGG…
,/ R<'27#1#'4!%'!<)K+7!<'!%,!;S,3'!*$<,27'!<+!&O2'/!
K/ 9*-#T'4!%,!3)5+'2*'!2+*%)$7#<#5+'!<+!1-,&('27!<?=@>(!*$<,27!;$+-!%'!<)K+7!<'!%,!
;-$7)#2'/!
*/ 0)<+#3'4P'2!%,!3)5+'2*'!<'!%,!;-$7)#2'!*$--'3;$2<,27'/!U7#%#3'4!%'!*$<'!&)2)7#5+'!'2!
,22':'/!
</ V2!,!#3$%)!+2'!;-$7)#2'!(+7,27'!<,23!%,5+'%%'!%,!;-'(#O-'!3)-#2'!'37!-'(;%,*)'!;,-!
+2'!,-&#2#2'/!
E+'%%'3!(+7,7#$23!2+*%)$7#<#5+'3!;$+--,#'27!':;%#5+'-!*'!*S,2&'('27!<?,*#<'!
,(#2)!M!
'/ 0,23!+2'!;,7S$%$&#'G!$2!7-$+T'!+2'!1$-('!)*$+-7)'!<'!%,!;-$7)#2'!W!3'+%3!%'3!7-$#3!
;-'(#'-3!,*#<'3!,(#2)3!3$27!;-)3'273/!E+'%%'!(+7,7#$2!2+*%)$7#<#5+'!,!'+!%#'+!M!
!
C/ X,%*+%'-!%'!(odèle!<'!YK,*Z&-$+2<Y!(composition!en!nucléotides)!;$+-!%,!3)5+'2*'!<6=0>!!
acctgcactg.
D/ 97,27!<$22)!+2!<#*7#$22,#-'!*$27'2,27!%,!;-$K,K#%#7)!<?,;;,-#7#$2!<'!*S,5+'!*$<$2G!;,-!
':'(;%'!W!codons = {‘TTT’ : 0.001, ‘TTC’ :0.002, …}!'7!+2'!3)5+'2*'!<'!*$<$23!
3$+3!1$-('!<'!%#37'!S=(‘TTT‘, ‘TCA’, TGA‘, …)G!<$22'4!%'!*$<'!;F7S$2!5+#!*,%*+%'!!%,!
;-$K,K#%#7)!p!<'!J!)7,27!<$22)!%'!($<O%'!<'!*$<$23![p\!][J!\!*^!*.!///*>!_!codons`!`!
I/ N'3!;-$($7'+-3!3$27!<'3!3)5+'2*'3!<6=0>,!généralement!en!amont!du!début!du!gène!et!
responsable!de!sa!régulation.!R%!F!,!S,K#7+'%%'('27!<'3!T,-#,7#$23!<,23!%,!*$(;$3#7#$2!<'!%,!
3)5+'2*'!<+!3#7'!;-$($7'+-!['2!&)2)-,%!<'3!3+K37#7+7#$23`/!!
!
0'3!':;)-#'2*'3!K#$%$&#5+'3!$27!;'-(#3!<'!<)7'-(#2'-!%'3!3)5+'2*'3!<'!;-$($7'+-3!3+#T,27'3W!
! acgact
acgtga
agcccc
acgtca
tcgtct
acgtca
acgtca
accgca
tggtca
acctct
,/ X,%*+%'4!%,!(,7-#*'!<'3!1-)5+'2*'3!<'!2+*%)$7#<'3!;,-!;$3#7#$2!a#b![#W!#2<#*'!<'!
2+*%)$7#<'G!bW!#2<#*'!<'!;$3#7#$2`/!@,b$+7'4!<'3!;3'+<$P*$(;7,&'3/!
K/ X,%*+%'4!%,!(,7-#*'!<'!3*$-'!;,-!;$3#7#$2G!c#b!\!%$&8[a#bd;#`G!$e!;#!'37!%,!;-$K,K#%#7)!<+!
2+*%)$7#<'!#!,T'*!%'!($<O%'!<'!K,*Z&-$+2<!
f/ J+;;$3$23!5+?+2'!K,*7)-#'!'37!,77'#27'!;,-!+2!T#-+3!5+#!,11'*7'!%,!(,*S#2'-#'!<'!%,!
-);%#*,7#$2!,%),7$#-'('27!'2!*S,2&',27!%,!(,2#O-'!<$27!*S,5+'!2+*%)$7#<'!'37!-'*$;#)W!!
*S,5+'!=!;'+7!g7-'!-);%#5+)!*$(('!A!=G!*S,5+'!X!;'+7!g7-'!-);%#5+)!*$(('!B!XG!*S,5+'!h!
;'+7!g7-'!-);%#5+)!*$(('!B!hG!'7!*S,5+'!i!;'+7!g7-'!-);%#5+)!*$(('!A!i/!!
a. 0$22'4!+2!,%&$-#7S('![;F7S$2!$+!;3'+<$P*$<'`!5+#G!;$+-!<'+:!3)5+'2*'3!+!'7!T!
<)7'-(#2'!3#!+!;'+7!g7-'!+2'!T'-3#$2!#21'*7)'!<'!T/!
K/ 0$22'4!+2!,%&$-#7S('![;F7S$2!$+!;3'+<$P*$<'`!5+#!)7,27!<$22)!+2'!3)5+'2*'!J!<'!%,!
K,*7)-#'!'7!+2!<#*7#$22,#-'!<$22,27!%,!;-$K,K#%#7)!<'!-);%#*,7#$2!<'!*S,5+'!
2+*%)$7#<'3G!;-$<+#-,!,%),7$#-'('27!+2'!3)5+'2*'!#21'*7)'/!!
],-!':'(;%'G!3#!S=ACCTG!'7!P={‘A’:0.2,‘C’: 0.5,‘G’: 0.3,‘T’: 0.1}G!%,!
;-'(#O-'!%'77-'![+2!=`!,!8^j!<'!*S,2*'!<?g7-'!-);%#5+)!*$(('!A!=G!%,!3'*$2<'![+2!X`G!
C^j!<'!*S,2*'3!<'!<'T'2#-!B!XG!'7*/!!
*/ N'!T#-+3!,!(+7)G!'7!'2!;%+3!<'!-,b$+7'-!<'3!*$;#'3!(+%7#;%'3!<?+2'!;$3#7#$2!;'2<,27!%,!
-);%#*,7#$2G!#%!'37!)&,%'('27!;$33#K%'!5+'!%'!2+*%)$7#<'!2'!3$#7!;,3!-'*$;#)G!
;-$T$5+,27!+2'!<)%)7#$2/!k$<#1#'4!%?,%&$-#7S('!<'!5+'37#$2!l,m!;$+-!;-'2<-'!'2!
*$(;7'!*'!2$+T',+!;S)2$(O2'/!V2!<#-,!;,-!':'(;%'!5+'!*S,5+'!2+*%)$7#<'!,!8j!<'!
*S,2*'3!<'!2'!;,3!g7-'!-'*$;#)/!!
!
=%#&2'('27!;,-!;,#-'!
.` =%#&2'-!&%$K,%'('27!%'3!<'+:!3)5+'2*'3!3+#T,27'3!W!U\=XhXX=i!'7!Q\hXXXi=G!'2!
,;;%#5+,27!%'!3F37O('!<'!3*$-'3!3+#T,27!W!k,7*S\8G!k#3(,7*S\P.G!h=]\PA/!=!;,-7#-!<'!%,!!
(,7-#*'!*$237-+#7'G!'2!<)<+#-'!%'!3*$-'!<'!%?,%#&2'('27!&%$K,%!$;7#(,%G!':7-,#-'!+2!
,%#&2'('27!$;7#(,%G!'7!*,%*+%'-!%'!2$(K-'!<?,%#&2'('273!5+#!$27!*'!3*$-'!$;7#(,%/
8` V2!,!;,-7#'%%'('27!-'(;%#!%,!(,7-#*'!<'!;-$&-,((,7#$2!<F2,(#5+'!*$--'3;$2<,27!L!+2!
,%&$-#7S('!<?,%#&2'('27!<'!3)5+'2*'3!<?=0>n!%,!T$#*#!W!!
!
!
a. E+'%!7F;'!<?,%#&2'('27!8!L!8!'37P$2!'2!7-,#2!<'!-),%#3'-!M!
b. ]$+-!-'(;%#-!*'77'!(,7-#*'G!5+'%!*$o7!,!)7)!+7#%#3)!;$+-!%'3!p!h,;3!q!M!;$+-!%'3!p!k,7*S!q!M!;$+-!%'3!
p!k#3(,7*S!q![%'!*$o7!<'3!p!k#3(,7*S!q!'37!#2<);'2<,27!<+!*$+;%'!<'!2+*%)$7#<'3!*$23#<)-)3`!M!
c. i'-(#2'4!%'!-'(;%#33,&'!<'!%,!&-#%%'/
</ ]-$;$3'4!+2!,%#&2'('27!$;7#(,%!;$33#K%'/!
A` N?,%&$-#7S('!<?,%#&2'('27!&%$K,%!<'3!<'+:!3)5+'2*'3!X=Xhi!'7!=hi!<$22'!%,!7,K%'!<'!
;-$&-,((,7#$2!<F2,(#5+'!3+#T,27'!W!
a) Pour remplir cette matrice, quel coût a été utilisé pour les « Gaps » ? pour les « Match » ? pour les «
Mismatch » (le coût des « Mismatch » '37!#2<);'2<,27!<+!*$+;%'!<'!2+*%)$7#<'3!*$23#<)-)3)?
b) Proposez un alignement optimal possible.
4) Q$#*#!%?,%#&2'('27!$K7'2+!;$+-!<'+:!3)5+'2*'3W!
CGTTAACG---ACTGTCT
CG-TATCGGCCACTATCT
X,%*+%'4!%'!3*$-'!<'!*'7!,%#&2'('27!<,23!%'3!*,3!3+#T,273W!
,`!k,7*S\!8G!k#3(,7*S\P.G!h=]\P8!
K`!X$(('!;$+-!,`G!(,#3!,T'*!+2!3*$-'!<'!&,;!,11#2'![$+T'-7+-'\PAG!':7'23#$2\P.`!!
*`!X$(('!;$+-!K`!(,#3!,T'*!%,!(,7-#*'!<'!3#(#%,-#7)!3+#T,27'W!!
!
!
!
!
"N=Ji!
!
.`!N,!1#&+-'!.!-';-)3'27'!%'3!-)3+%7,73!<?+2'!-'*S'-*S'!<'!3#(#%,-#7)!'11'*7+)'!,+!($F'2!<'!%?$+7#%!
"N=JiG!;$+-!#<'27#1#'-!<,23!%'!&)2$('!S+(,#2!%'3!-)&#$23!*$<,27!;$+-!%?'24F('!,*F%;S$3;S,7,3'/!
!
,` E+'%%'!'37!%,!%$2&+'+-!<'!%,!3)5+'2*'!-'5+g7'![;-)*#3'4!%?+2#7)`!M!
K` E+'%%'!($<,%#7)!<'!"N=Ji!,!)7)!+7#%#3)'!'7!;$+-5+$#!M!
*` X$(('27!#27'-;-)7'-!%'3!9PT,%'+-3!-'3;'*7#T'3!<'3!<'+:!S#73!<'!%,!1#&+-'!.K!M!E+'%!'37!%'!
('#%%'+-!S#7!M!
<` 0,23!5+'%%'!;S,3'!%'3!S#73!3$27P7P#%3!7-$+T)3!M!
'` 9:;%#5+'-!;$+-5+$#!<,23!%'!<'+:#O('!S#7!%,!T,%'+-!<'!;$3#7#T#7)!'37!3+;)-#'+-'!L!%,!T,%'+-!
<?#<'27#7)/!
2) On considère les deux quences d’ADN :
ATTCATTCATTCATTCATTCATTCATTCATTC et
ATTGATTGATTGATTGATTGATTGATTGATTG.
Quel est, à première vue, leur pourcentage d’identité? Quand on fait un alignement avec l’algorithme de
BLAST (avec une taille de mot de 4), aucune similarité n’est trouvée. Pourquoi?
!
3) Donner le code en python ou pseudo code pour générer la base de données de BLAST. Votre fonction
aura la signature db(sequences, w), où sequences est un dictionnaire de séquences et w est la taille
de mot. Exemple:
sequence = {‘s1’: ‘acgta’, ‘s2’: ‘aacgta’, ‘s3’: ‘acggta’} et w=3, votre fonction doit renvoyer.
!
{acg : [(s1,1), (s2,2), (s3,1)],
cgt : [(s1,2), (s2,3)],
gta : [(s1,3), (s2,4), (s3,4)],
aac:[(s2,1)],
cgg:[(s3,2)],
ggt:[(s3,3)]}
!
4) Montrez comment la séquence cgtca sera alignée par BLAST en utilisant les séquences et la base de
donnée indexée de la question précédente.
1 / 11 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !