Ecole doctorale – Evry 2004 Modélisation déterministe de réseaux de gènes : Le répresseur λ du bactériophage λ Mestivier Denis Équipe « modélisation en biologie intégrative » Institut Jacques Monod - CNRS, Universités Paris 6&7, 2 place Jussieu, 75251 Paris Cedex 05 Plan de la présentation • Poser les bases de biologie moléculaire nécessaires • Montrer sur un exemple la stratégie de modélisation déterministe • Illustrer que même un réseau simple peut conduire à des résultats surprenants dès que l’on prend en compte les interactions et leurs dynamiques. mestivier@ fr mestivier@ ijm.jussieu. ijm.jussieu.fr Tout organisme est constitué de cellules Bases de biologie moléculaire Pr. Silar, Université Paris 7 http://…. Les cellules procaryotes • On les regroupe sous le terme générique de Bactéries (2 grands groupes : eubactéries et archaebactéries) • 1665 : premières cellules décrites par Robert Hooke 1665 • 1839 : théorie actuelle (Mathias-Jacob Schleiden et Théodore Schwann) • Toute cellule naît d'une cellule – Ceci implique que l'information présente dans un organisme n'apparaît pas spontanément – Elle est produite à partir d'une information préexistante. – Elle doit donc être dupliquée avant d'être transmise. • Les analyses biologiques du début du siècle ont conduit à distinguer deux grands types de cellules, suivant leur constitution et leur mode de reproduction. Les cellules eucaryotes • Le matériel génétique est dans séparé du cytoplasme – Noyau • Organisation cellulaire complexe • Organismes : – Levure –… – mammifères 1 Nature de l'information génétique Les virus • Contrairement aux procaryotes et eucaryotes, ils sont incapables de diviser seuls leur information génétique • Structure simple : – Sac (capside) contenant l’information génétique • Parasites obligatoires : • Destruction de l’hôte • Insertion/vie dans l’hôte capside Matériel génétique • Stockée sur une molécule chimique : ADN • 4 bases : A, C , T , G AGAAT T CAGT A • Règle appariement – A T et C G – double hélice T C T T AAGT CAT AGAAT T CAGT A queue • homme = 3 milliard pdb • bactériophage λ = 48502 pdb Le gène • séquence sur l'ADN qui code pour une information (ex: protéine) Protéines • constituants très importants pour la cellule : – Composant structural : • Récépteurs membranaires – fonctionnement de la cellule : • Voies métaboliques (ex: enzymes) • machinerie de synthèse de l’ADN • homme = entre 18000 et 50000 gènes • bactériophage (virus) = ~ 40 gènes Des gènes aux protéines 1/ transcription • gène protéine : nécessite intermédiaire – ARN message (ARNm) • Molécule composée d'unités de base : les acides aminés ( n= 20) • message génétique : – (alphabet à 4 lettres) alphabet protéique (20 lettres) Des gènes aux protéines 2/ traduction • ARNm protéine : traduction • ADN ARNm : transcription – Grâce aux règles d’appariement – A—U, C—G – ARNpolymérase 2 Transcription / ARN polymérase • l'ARNpol reconnait des sites spécifiques en amont du gène : les promoteurs • Entre le promoteur et le début du gène, on peut trouver des sites de régulation : les opérateurs. (auto)-régulation +/• Les protéines peuvent réprimer/activer des régions du gène • un gène est sous la dépendance d'un promoteur • une protéine est synthétisée par un gène Transcription/ARNpol (Promoteur) ARNm ADN GENE Traduction PROTEINE activation/répression (opérateurs) λ : un virus, organisme modèle (bactériophage) Bactérie Escherichia Coli • Organisme unicellulaire • découvert par Théodor Escherich en 1885 • hôte normal de la flore intestine chez l’homme : – croît sans causer de maladie – fabrique aussi la vitamine K • indispensable pour l'homme – certaines souches toxiques (O157:H7) Escherichia Coli • génome de 4500 kpb • courte (2 à 3 µm x 0.7 µm) • agent d'infections – intestinales et extra-intestinales bactériophage lambda • virus parasite de E. Coli • ADN : 48502 pdb • en début d'infection : – Lytique – Lysogénique • notion de décision : – mécanisme moléculaire – 2 gènes / 2 promoteurs – 3 opérateurs 3 Devenirs de lambda lors de l'infection d'une bactérie LYSE LYSOGENIE La phase lytique • le virus utilise la machinerie cellulaire : – se dupliquer – lyser la paroi bactérienne • libérer dans le milieu extérieur les virus fils • Cette phase : – Dure environ 45 min – relargue ~ 100 virus. • La bactérie est détruite Phase lysogénique • le virus s'intègre dans le génome de la bactérie – dupliqué lors de la division bactérienne. • la bactérie lysogène bloque les autres virus qui viendraient à l'infecter • phénomènes d'échappement : – Ex: UV – Passage en lytique – p = 10-4 à 10-5 Points fondamentaux à retenir • Lorsqu'un virus infecte une bactérie, il a deux devenirs possibles : lytique ou lysogénique • Suivant le milieu, un choix est privilégié. • Cette décision est sous le contrôle : – d’une petite région du génome d'une centaine de paires de bases (par rapport au 48 502 pb) – 2 gènes et 2 promoteurs • Cette région de régulation : switch génétique Génome du bactériophage Région de régulation Gènes regroupés par ensembles fonctionnels Zone de décision (zone de switch) CI CRO 4 Le switch : synthèse Le Switch • Chacune des deux protéines CI et CRO va inhiber la synthèse de l'autre et augmenter sa propre synthèse. • Selon les conditions de culture, une des deux protéines va prendre le dessus sur l'autre (en termes de concentration). • Alors on entrera dans un cycle lytique ou lysogénique. • Le combat CI/CRO se déroule au niveau de l'opérateur Or : – Or comporte trois parties distinctes : Or1, Or2 et Or3 • Les protéines CI et CRO (dimères) ont des affinités inverses pour les trois parties du site : – CI a une affinité croissante pour Or3 < Or2 < Or1 – CRO a une affinité croissante pour Or1 < Or2 < Or3. Diagramme du réseau de gènes Le switch : synthèse • Si CI se fixe le premier sur Or1 : – il gène la fixation de la RNA-pol. sur le promoteur (Pr) de la transcription de CRO – augmente sa propre transcription à partir du promoteur Prm. – Cela facilite aussi la fixation d'un deuxième dimère sur Or2 : amplification du processus. • Le processus inverse se produit pour CRO. Systèmes déterministes Problème biologique ? lyse faible lysogénie fort Relation entre réactions (bio)chimiques et équations différentielles [CI] La quantité importante est [CI] Quelles valeurs de [CI] au cours du temps (lyse/lysogénie) en fonction de son tau de dégradation ? 5 Modélisation d'une réaction chimique • L'approche de modélisation adoptée est celle des systèmes dynamiques. dynamiques • Elle décrit l'évolution d'une (ou de) quantité(s) biologiques(s) par des équations différentielles. • Les équations : – ont pour but de décrire l’évolution de l’espèce moléculaire au cours du temps, – expriment la variation d'une petite quantité sur un petit intervalle de temps. – Il y a une étape qui passe des variations sur un petit temps à l’évolution sur un long temps. Réactions chimiques élémentaires • Ce sont des réactions qui font intervenir peut d’espèces ensemble • Elles expriment des réactions simples • Par exemple : – Dégradation : A – Transformation : A k1 k1 -B • Ainsi : dx / dt = f( x ) • où x représente la quantité biologique, par exemple la concentration CI, répresseur λ • La fonction f(x) indique, sur un court instant, comment change cette quantité. Réactions chimiques élémentaires • Beaucoup d’interactions dans un réseaux de gènes se ramènent à des réactions chimiques élémentaires • Formalisation par la loi d’action de masse • Obtention des équations différentielles X’=f(X) • Il est maintenant possible de déterminer les valeurs A(t), B(t) et C(t) en intégrant les équations du système B – Analytique – Numérique (Matlab, Mathématica, C, etc…) Propriétés du modèle Relations bio/équations A k1 k-1 • Il faut bien réaliser que les fonctions fi(X) contiennent toute l'information sur le système biologique • Dès lors que l'on a exprimé sous forme d'équations différentielles des connaissances biologiques, on peut utiliser la théorie des systèmes dynamiques pour répondre à un certain nombre de questions d'ordre biologique : – Quels sont les comportements dynamiques possibles du système ? – Quels sont les états d'équilibre du système ? – Quelle est la stabilité de ces états d'équilibre face à une petite perturbation ? – Comment évolue le système si je change un paramètre ? 6 • dx/dt = 2.k-1.y - k1.x2 • dy/dt = -k-1.y + k1.x2 dimérisation • dD1/dt = k2 y D0 - k-2 D1 • dD2 D1 /dt = k3 y D1 - k-3 D2 D1 • dD3 D2 D1/dt = k4 y D2 D1 - k-4 D3 D2 D1 fixations • dx/dt = 2.k-1y - k1x2 + n.kt.P.(D0+D1+α.D2D1) –kxx + 5 équations • dx/dt = … + kt.n. D0.P • dx/dt = … + kt .n. D1 .P • dx/dt = … +α.kt.n. D2D1.P synthèse dégradation • dx/dt = … - kx.x Cinétique simplifiée de [CI] au cours du temps m (1 + x2 + α σ1 x4 ) • dx/dt = 1+ x2 + α σ x4 + σ σ x6 1 1 2 Terme de production - γx x Terme de dégradation Phénomène : switch génétique Problème biologique ? Étape 1: réseau de gènes du répresseur λ (diagramme des interactions) Étape 2 : Réactions chimiques lyse faible lysogénie fort [CI] Étape 3 : Modèle mathématique ou computationnel Agents La quantité importante est [CI] = variable x Déterministe Réactions chimiques Équations différentielles Stochastique On essaie de déterminer une équation simplifiée pour x Notion de point fixe x • Un point fixe d’un système est la notion mathématique de l’équilibre : – dx / dt = f(x) = 0 temps x part d’une valeur initiale puis x évolue au cours du temps si x se stabilise, alors dx/dt = 0 mais dx/dt = f(x) f(x) détermine les solutions stationnaires • C’est lorsque la variable d’intérêt (ici [CI]) ne change plus au cours du temps • Ceci signifie que le bilan est nul, c’est-à-dire que ce qui est crée compense parfaitement ce qui est détruit • La vitesse d’évolution de [CI] au cours du temps est nulle 7 On ne résout pas l’équation différentielle, on va chercher les zéros de la fonction f() Notion de stabilité • Lorsque l’on a un équilibre, si on le perturbe un peu, va-t-il revenir dans l’état où il était ou bien, ou bien va-t-il changer ? f(x) x Forte dégradation : γx=8 Faible dégradation : γx=1 UN état d’équilibre x ~ 4.3449 10 7 9 6 ] X [ 10 0 8 -5 5 7 7 4 ) a u ( 6 ) X ( f 5 3 2 X 4 1 3 1 0 1 2 3 4 5 6 Temps (ua) 7 8 9 4 -25 3 2 1 0 0 0.5 1 1.5 2 2.5 X 3 3.5 4 4.5 5 -30 -35 0 0.5 1 1.5 Temps (ua) 2 2.5 3 -40 0 0.5 1 1.5 2 2.5 X 3 3.5 4 4.5 5 Diagramme de bifurcation Dégradation intérmédiaire : γx=5 Faible dégradation TROIS états d’équilibre ! x ~ 0.2070 x ~ 1.5114 10 ) -15 X ( f -20 5 0 -2 10 -10 6 -1 2 0 5 9 8 ) a u ( UN état d’équilibre x ~ 0.12 Zone bistable 5 9 forte dégradation 8 7 0 ) a u ( X 6 ) X ( f 5 4 -5 3 2 1 0 0 0.5 1 1.5 Temps (ua) 2 2.5 3 -10 0 0.5 1 1.5 X 2 2.5 3 8 Couplage avec protéase Construction d’un oscillateur Diagramme de phase 1000 • Considérons la gène de la protéase sous la dépendance d’un promoteur Prm 800 600 400 200 0 0 1 2 3 CI • Quand [CI] grand forte synthèse de RscA • Quand [RscA] grand forte dégradation de CI 3 600 2 500 1 400 0 0 200 4 RcsA 400 300 0 200 400 9