Devoir - Jean

publicité
STH, Modélisation mathématique
mars 2017
Devoir
Le virus de l'immunodécience humaine (VIH), responsable du SIDA, est un virus qui détruit
des cellules du système immunitaire. La première partie de ce devoir sera consacrée à un modèle
simple décrivant l'infection des lymphocytes par le virus. La seconde partie s'intéressera au code
génétique du VIH.
1
Infection par le VIH
Décrivons le processus d'infection :
- L'organisme (le thymus pour être précis) produit en permanence de nouveaux lymphocytes.
- Une particule virale (ou virion), une fois introduite dans l'organisme, repère un lymphocyte
sain et s'y xe.
- Elle fusionne avec la cellule et entraîne la modication de son ADN.
- Le lymphocyte infecté va alors produire de nouvelles particules virales.
On note S(t) la quantité de lymphocytes sains dans l'organisme, I(t) la quantité de lymphocytes infectés et V (t) la quantité de virions. On modélise l'infection des lymphocytes par le
VIH par le système diérentiel suivant.
 0
 S = s − ηS − λSV
I 0 = λSV − µI
 0
V = τ I − νV − λSV
1. Expliquer ce modèle et interpréter chacun des termes de ce système.
2. Quelle est, en l'absence de virus, l'équation satisfaite par S . La résoudre et donner la
valeur de S à l'équilibre.
On suppose dans la suite que la quantité de lymphocytes est initialement à l'équilibre
et qu'une quantité V0 de virions vient d'apparaître.
3. Déterminer les points d'équilibre du système et les interpréter.
λsτ
.
4. Étudier la stabilité du plus simple des deux en fonction de la valeur seuil R = µ(ην+λs)
Intuitivement, comment devrait évoluer l'infection ?
Pour représenter l'évolution du système, il faudrait en étudier les variations et utiliser
des graphiques en 3D. Pour éviter cela, nous allons abusivement simplier le système
en supposant que les lymphocytes infectés ont déjà atteint leur équilibre : I 0 = 0 donc
I = µλ SV . Cela permet de remplacer I dans les autres équations et obtenir un système
à deux équations en S et V .
5. Étudier les variations de ce nouveau système. Représenter la trajectoire de la solution
(S(t), V (t)) du problème dans les deux cas possibles en faisant bien apparaître le ou les
points d'équilibre.
6. Dans le cas le plus intéressant, représenter les graphes de V (t) et S(t) en fonction de
t. Comment évolue la charge virale au cours du temps ? Quelle est la conséquence de
l'infection sur la quantité de lymphocytes sains ?
7. Interpréter les termes de R et leur rôle dans l'évolution de l'infection. Sur quel facteur
inuent les antirétroviraux parfois utilisés dans la lutte contre le VIH ?
2
Code génétique du VIH
Nous l'avons vu, l'action du VIH consiste seulement en un parasitage des lymphocytes. Son
ARN est simple et contient peu de bases nucléiques. Les bases nucléiques (A, C , G et T ) sont
les éléments de base permettant de coder toute l'information : l'ARN est ainsi décrit par la
séquence de ses bases. Cette séquence se découpe en codons, c'est-à-dire en séquences de trois
bases successives, chacun étant lié à la production d'un acide aminé.
Pour étudier le VIH, les biologistes étudient le code de son ARN. Ils étudient notamment
à l'aide de chaînes de Markov la répartition statistique des bases et des codons. L'idée est de
considérer que leur répartition est aléatoire en un sens qu'il s'agit de préciser. Un des objectifs
de ces études est de pouvoir caractériser et classier les mutations (très fréquentes) du VIH
pour mieux comprendre son évolution ou de pouvoir diérencier les diérentes parties codantes
de l'ARN.
Nous fournissons dans le chier Maple le code du VIH de référence ainsi qu'un programme
dénombrant le nombre d'occurrences d'une séquence donnée.
1. Donner les fréquences d'apparition des lettres A, C , G et T . On considérera qu'il s'agit
de probabilités.
2. Donner la fréquence de la séquence AT . En déduire la probabilité PA (T ) qu'une lettre
T vienne après un A : c'est la probabilité de transition de A vers T .
3. Construire ainsi la matrice de transition pour les 4 états possibles A, C , G, T et représenter la chaîne de markov associée.
4. Calculer la mesure invariante de cette chaîne de Markov. Comparer les fréquences théoriques des quatre lettres avec celles observées.
5. Quelle est la probabilité théorique d'observer une séquence AC ? Comparer avec la probabilité observée.
6. Recommencer avec d'autres séquences de 2 lettres ainsi qu'avec quelques codons. La
représentation du code par une chaîne de Markov vous semble-t-elle judicieuse ? Le caractère markovien du code vous semble-t-il naturel ou étonnant ?
Nous fournissons dans le chier Maple la matrice de transition pour les séquences de 2
lettres. On considère ici qu'on passe de l'état GC à l'état CA si on obtient une séquence
GCA. Le passage de GC à T T est donc impossible.
7. À l'aide de la matrice, calculer les 16 fréquences théoriques des 16 séquences de deux
lettres et les comparer aux fréquences observées.
8. Calculer également les probabilités d'obtenir un codon de glutamine ou un codon Stop
et les comparer aux données observées. (Le tableau des acides aminés liés aux codons
est disponible en cliquant sur Wikipedia.)
Téléchargement