Module LV348 Version enseignant TD 1 – page 3/7
Solution :
Encore des dico, introduction des autres types énumérés : liste et tuple .
Question plus bio : les phases de lectures, détection des CDS.
Pour info, les ORFs sont les séquences entre 2 STOP en phase et non un START et un STOP
C’est le premier algo un peu compliqué, bien y réfléchir.
1# Retourne la liste des orf de la seq
2#
3def findorf(seq):
4start = ("ATG")
5stop = ("TAA","TAG","TGA")
6startlist = [-1,-1,-1]
7orflist = []
8for iin range(len(seq)-2):
9if seq[i:i+3] in start:
10 if startlist[i%3] == -1:
11 startlist[i%3] = i
12 elif seq[i:i+3] in stop:
13 if startlist[i%3] != -1:
14 # Attention n’inclus pas le stop
15 orflist.append(seq[startlist[i%3]:i])
16 startlist[i%3] = -1
17 return orflist
./code/orf.py
2.4 Traduction
Ecrivez une fonction python qui à partir d’une séquence nucléique retourne la séquence protéique
correspondante (en utilisant le code génétique à une lettre qui vous a été donné et qui se trouve au lien
suivant : http://www.snv.jussieu.fr/bmedia/codegenet/CodeGenet.htm).
Solution :
Cette fonction ne nous servira pas vraiment mais elle permet d’introduire le code génétique et de
parler de redondance.
1# effectue la traduction de la sequence seq
2def traduction(seq):
3code = {"TTT":"F","TTC":"F","TTA":"L","TTG":"L","TCT":"S","TCC":"S",
4"TCA":"S","TCG":"S","TAT":"Y","TAC":"Y","TAA":"*","TAG":"*",
5"TGT":"C","TGC":"C","TGA":"*","TGG":"W","CTT":"L","CTC":"L",
6"CTA":"L","CTG":"L","CCT":"P","CCC":"P","CCA":"P","CCG":"P",
7"CAT":"H","CAC":"H","CAA":"Q","CAG":"Q","CGT":"R","CGC":"R",
8"CGA":"R","CGG":"R","ATT":"I","ATC":"I","ATA":"I","ATG":"M",
9"ACT":"T","ACC":"T","ACA":"T","ACG":"T","AAT":"N","AAC":"N",
10 "AAA":"K","AAG":"K","AGT":"S","AGC":"S","AGA":"R","AGG":"R",
11 "GTT":"V","GTC":"V","GTA":"V","GTG":"V","GCT":"A","GCC":"A",
12 "GCA":"A","GCG":"A","GAT":"D","GAC":"D","GAA":"E","GAG":"E",
13 "GGT":"G","GGC":"G","GGA":"G","GGG":"G"}
14 tradseq = ’’
15 for iin range(0,len(seq)-2,3):
16 tradseq += code.get(seq[i:i+3], ’X’)
c
2013-2014 (by UPMC/Licence de biologie/LV348) 15 janvier 2014