.
for cc in codons.keys():
print cc, codons[cc]
3) On s'intéresse uniquement aux codons synonymes de la Proline. Peut-on dire que ces 4
codons sont utilisés de façon aléatoire (c’est-à-dire sont équiprobables)? Justifier.
./script.py | grep “^CC” (optionnel)
CCT 9518
CCG 31657
CCC 7439
CCA 11488
Hypothèse: H0, utilisation alétoire des 4 codons synonymes. On fait un test de
rejet de cet hypothèse à l’aide d’un chi-deux de conformité.
Dans R,
chisq.test(c(9518,31657,7439,11488), p=c(0.25,0.25,0.25,0.25))
Chi-squared test for given probabilities
data: c(9518, 31657, 7439, 11488)
X-squared = 25091.23, df = 3, p-value < 2.2e-16
La différence est très significative (p-value proche de 0), dons on rejette H0
avec un risque très faible de se tromper. L'utilisation des codons synonymes
n'est pas aléatoire. Il y a des codons “préférés”.
4) Plusieurs hypothèses ont été proposées pour expliquer ce résultat. En vous basant sur
certaines caractéristiques génomiques vues en TD, comment expliquer l'écart entre les codons
CCC et CCG ? Faire un schéma si cela est nécessaire.
Effet de la réplication/désamination:
Les CDS ne sont pas également répartis entre les deux brins du
chromosome bactérien. Ils se situent en excès sur le brin matrice des
fragments d'Okasaki.
le brin matrice des fragments d'Okasaki est particulièrement riche en
guanines (relativement à sa richesse en cytosines). Une hypothèse est qu’il
est plus sensible à la désamination hydrolytique (plus souvent simple brin)
mais cette hypothèse à elle seule n’explique pas tout.
la troisième position des codons de la Proline étant synonyme, elle est
particuièrement sensible au biais mutationnels du brin sur lequel se situe le
CDS donc plus de codons synonymes finissant en G.
D’autres hypothèses pouvaient être avancées comme un effet transcription,
un effet associé à la disponibilité des ARNt, …