Série de lectures sur la Dynamique Moléculaire: ● ● Application pratique (boîte d'eau) ● Patrick Lagüe, Université Laval Concepts Théoriques Méthodes de solvant implicite Les outils de modélisation moléculaires Analogie avec les modèles de plastique: La version électronique permet d'aller plus loin: ● ● ● Patrick Lagüe, Université Laval Calculs d'énergie Explorer l'espace conformationnel Étudier la dynamique des molécules Avantages et désavantages Avantages: ● Description atomique des molécules. ● Suivi complet de la dynamique des molécules (diffusion, orientation, ...). ● Utilisation des conditions physiologiques (marqueurs, etc...). Désavantages: ● Beaucoup d'informations à gérer (utilisation d'environ 25000 atomes). ● Méthode lente (semaines, mois). ● Échelle de temps accessible de l'ordre de 10-100 ns. ● Plusieurs approximations sont impliquées (détails plus loin). Patrick Lagüe, Université Laval Débuts de la DM ● Fin des années 50, par B.J. Alder et T. E. Wainwright. ● Jusqu'à 500 boules dures modélisant des particules. ● Pour étudier les différents états de la matière (solide, liquide, gaz). ● Les résultats sont comparés avec les résultats “théoriques” et expérimentaux. Ce sont des expériences effectuées à l'aide d'un ordinateur! (J. Chem. Phys. 27, 1208 (1957); J. Chem. Phys. 31, 459 (1959)). Patrick Lagüe, Université Laval Autres étapes importantes En 1964: A. Rahman simule de l'argon liquide avec un potentiel de LennardJones. (Phys. Rev. A 136, 405 (1964)) En 1974: Simulation de DM de l'eau liquide donnant des résulats comparables aux résultats expérimentaux. (Stillinger, F. H. and Rahman, A. J. Chem. Phys. 60, 1545 (1974)) Patrick Lagüe, Université Laval Première simulation d'une protéine ● En 1977, par J.A. McCammon, B.R. Gelin et M. Karplus. ● L'inhibiteur de la trypsine du pancréas de boeuf (BPTI). ● 58 acides aminés et 4 molécules d'eau. ● Durée de la simulation 3.2 ps (3.2 x 10-12 sec.) ● Les protéines bougent! (Nature (Lond.) 267, 585 (1977)) Patrick Lagüe, Université Laval La base: L'équation du mouvement La seconde loi de Newton (1687) décrit la relation entre la force et l'accélération pour une particule: Force = Masse x Accélération En termes mathématiques: F i =mi ai Cette équation est aussi reliée à la vitesse et à la position de la particule: 2 d vi d ri F i =mi ai =mi =mi dt d t2 Si on connait la force appliquée sur une particule, on peut prédire sa position dans le temps! Patrick Lagüe, Université Laval Le champ de forces Décrit les interactions entre les différentes particules lors de la simulation. = F −dE pot r d r où Epot est l'énergie potentielle des molécules. Cette énergie potentielle est calculée à l'aide d'une fonction d'énergie potentielle empirique (description mathématique), communément appelée Champ de Forces. Deux critères sont à considérer pour un bon champ de forces: ● Rapide à calculer. ● Reproduire les données expérimentales et les calculs de chimie quantique. Patrick Lagüe, Université Laval Décomposition du champ de force L'énergie potentielle se décompose en trois termes: Epot = Einterne + Eexterne + Econtraintes L'énergie interne est associée à la déformation de la molécule: Einterne = Eliaison + Eangle + Eimpropre+ Etorsion L'énergie externe est l'énergie d'interaction avec les autres molécules: Eexterne = Evdw + Eélectrostatique + ElienH L'énergie des contraintes est l'énergie imposée pour satisfaire une contrainte (ex.: distance fixe entre deux atomes). Patrick Lagüe, Université Laval Eliaison Potentiel harmonique (loi de Hook): 2 E liaison =k liaison d −d 0 Décrit la variation d'énergie lorsque la longueur du lien entre deux atomes varie de la position d'équilibre d0: Énergie de liaison C-C 450 d Énergie (kcal/mol) 400 350 300 250 200 150 100 50 0 0.5 0.7 0.9 1.1 1.3 d (Ang) Patrick Lagüe, Université Laval 1.5 1.7 1.9 2.1 Eangle Potentiel harmonique (loi de Hook): 2 E angle =k angle −0 Décrit la variation d'énergie lorsque l'angle entre 3 atomes liés varie de sa position d'équilibre: Energie d'un angle C-C-C 500 Energie (kcal/mol) 450 400 350 300 250 200 150 100 50 0 105 106 107 108 Angle (degres) Patrick Lagüe, Université Laval 109 110 111 Eimpropre ● Permet de maintenir la chiralité de certaines molécules. ● Permet de tenir plan des groupements contenant des électrons délocalisés. ● Présent surtout au niveau du squelette des peptides et des protéines. Potentiel harmonique: 2 E impropre =k impropre −0 Energie selon l'angle impropre HCCH 500 Energie (kcal/mol) 450 400 350 300 250 200 150 100 50 0 -5 -4.5 -4 -3.5 -3 -2.5 -2 -1.5 -1 -0.5 0 0.5 1 Angle (degreés) Patrick Lagüe, Université Laval 1.5 2 2.5 3 3.5 4 4.5 5 Etorsion Pour décrire les différentes conformations accessibles par une molécule. E torsion =k torsion 1cosn − Energie (kcal/mol) Energie de torsion pour CCCC 0.325 0.3 0.275 0.25 0.225 0.2 0.175 0.15 0.125 0.1 0.075 0.05 0.025 0 cis trans -200 -150 -100 -50 0 50 Angle (degres) Patrick Lagüe, Université Laval 100 150 200 Evdw Les atomes espacés de moins de 2 liens ne participent pas aux interactions. Énergie intermoléculaire attractive et répulsive. Potentiel de Lennard-Jones: 12 6 r0 r0 E vdw =[ −2 ] r r Potentiel de LJ entre deux atomes de carbone 4.8 4.3 Énergie (kcal/mol) 3.8 3.3 2.8 2.3 1.8 1.3 0.8 0.3 -0.2 0 10 r (Angstrom) Patrick Lagüe, Université Laval Eelectrostatique Les charges sont modélisées par un point à la position de l'atome (point-charge). ➔ Signifie aucune polarisabilité (déformation de nuage électronique). Potentiel de Coulomb: qi q j E elec = 4 r Potentiel de Coulomb 3.5 3 2.5 - 2 1.5 Energie + - + Repulsion 1 0.5 0 -0.5 Attraction -1 -1.5 -2 0 1 2 3 4 5 6 7 8 r (angstrom) Les atomes espacés de moins de 2 liens ne participent pas aux interactions. Patrick Lagüe, Université Laval ElienH 2 philosophies différentes: 1) Présents de façon explicite: E lienH =[ C D − ] 12 10 r r 2) Balance entre Evdw et Eelectrostatique (plus courant et plus rapide). Patrick Lagüe, Université Laval Econtraintes Diverses contraintes peuvent être appliquées, lorsque des paramètres expérimentaux sont connus: ● Distances inter-protons. ● Angles dihèdres. ● Ponts hydrogènes. ● Orientations de liens. ● Etc... Aussi utilisé lors de l'équilibration des systèmes (détails plus loin). Patrick Lagüe, Université Laval Intégration de l'équations du mouvement 2 −dE pot r d r = F =m 2 L'équation de mouvement: d r dt Pour obtenir la force appliquée sur un atome, il ne suffit que de dériver l'énergie potentielle (facile, méthode analytique). Pour obtenir la position en fonction du temps, il faut intégrer la force: 2 2 ∬ F dt =∬ m d r (difficile, pas de méthode analytique) Vieux proverbe mathématique: “Dérive qui veut, intègre qui peut!” Patrick Lagüe, Université Laval Comment résoudre les intégrales Méthode de Verlet (leap frog): (D'autres méthodes existes: Velocity Verlet,etc...) Décomposition du temps en intervalle Dt très courts. Calcul de la vitesse et de la position suivant une équation tirée d'une série de Taylor pour résoudre les équations de mouvement. Pour la vitesse: Fx 1 1 v x t t =v x t − t t t 2 2 m Pour la position 1 2 Fx x t t = x t t v x t t t 2 m où 1 1 1 v x t = [ v x t − t v x t t ] 2 2 2 Patrick Lagüe, Université Laval Diagramme d'une simulation Coordonnées initiales Minimisation du système Assigner les vélocités initiales Équilibration Production de la trajectoire Analyse des résultats Patrick Lagüe, Université Laval Dynamique Coordonnées initiales 2 méthodes: ● Utiliser une structure déterminée expérimentalement (PDB). ou ● Placer les atomes/molécules dans une géométrie se rapprochant le plus de ce qu'on connaît expérimentalement (ex. bicouche lipidique). La seconde méthode nécessite habituellement une bonne minimisation. Patrick Lagüe, Université Laval Minimisation Pourquoi? Parce que la plupart du temps les molécules du système ne sont pas dans une géométrie d'énergie minimale. De telles géométries ont pour conséquence d'engendrer des forces considérables, et l'intégration de ces forces devient “instable”: - la dynamique “plante”, explose, etc... Un bon système de départ possède une géométrie ayant une énergie minimisée: Patrick Lagüe, Université Laval Méthodes de minimisation 4 Méthodes mathématiques pour trouver le minimum d'énergie: ● Descente abrupte (Steepest Descent) ● Gradient conjugué (Conjugate Gradient) ● Newton-Raphson ● Newton-Raphson à base adaptée (Adapted Basis Newton-Raphson) 2 Méthodes sont préférées pour les gros systèmes: ● SD: calcul rapide, efficace pour minimiser les mauvais contacts atomiques, converge mal près d'un minimum. ● ABNR: calcul plus lent, converge mal loin d'un minimum, converge bien près d'un minimum. Truc: alterner les méthodes pour utiliser les avantages de chacune, et se rapprocher du minimum global. Patrick Lagüe, Université Laval Assigner les vitesses initiales Cette étape est requise par les intégrateurs puisque ces derniers se basent sur la vitesse précédente pour calculer la vitesse suivante. F Les vitesses sont assignées au hasard, selon une distribution gaussienne ou uniforme, en respectant le théorème d'équipartition (relie la vitesse des atomes à la température): 1 3 2 m v = Nk b T 2 2 Si la dynamique est bien équilibrée, la méthode utilisée pour initialiser les vitesses n'aura pas d'impact sur les résultats. Patrick Lagüe, Université Laval La dynamique et ses paramètres Liste des paramètres (entre autres): Patrick Lagüe, Université Laval ● Timestep (Δt). ● Les distances et méthodes de troncations. ● Les conditions périodiques frontières. ● Particle-Mesh Ewald ● Les ensembles thermodynamiques. Comment choisir un timestep? Selon la fréquence de vibration la plus rapide des molécules étudiées. Pour les systèmes biologiques, c'est la fréquence vibrationnelle des liens hydrogènes qui sont les plus rapides (10-14 secondes). Pour assurer une bonne intégration des équations de mouvements, le timestep idéal doit être 1/10 de cette fréquence, soit 1fs. Il existe certains astuces permettant d'employer un timestep plus grand, mais dans ce cas la dynamique des molécules est remise en question. Patrick Lagüe, Université Laval Les distances de troncations (1) Le nombre approximatif d'interactions à calculer pour un système d'environ 22000 atomes: Énergie interne: ● 22000 liens, ● 10300 angles, ● 5300 angles de torsions et ● 400 angles impropres. Énergie inter-moléculaire: ● ½ n(n-1) pour les interactions VdW (~242 millions). ● ½ n(n-1) pour les interactions électrostatiques (~242 millions). Patrick Lagüe, Université Laval Les distances de troncations (2) Passé une certaine distance, les forces intermoléculaires sont négligeables: Potentiel de Coulomb Potentiel de LJ 3.5 3 2.5 1.55 2 1.3 1.5 Energie Energie (kcal/mol) 1.8 1.05 0.8 Repulsion 1 0.5 0 -0.5 0.55 Attraction -1 0.3 -1.5 0.05 -2 0 -0.2 0 10 1 2 3 4 5 6 7 8 r (angstrom) r (Angstrom) Pour accélérer les calculs, les interactions entre atomes espacés d'une certaine distance sont négligés. rc i Cette distance est appelée la distance de troncation rc (cutoff). Patrick Lagüe, Université Laval Les méthodes de troncations (1) Même si les forces sont petites passé la distance de troncation, elles existent. Effet collectif important sur plusieurs milliers d'atomes. Une coupure radicale des forces à la distance de troncation a pour effet d'introduire des artefacts dans les interactions moléculaires ● mauvaises densités. ● mauvaises distributions moléculaires. rc rb i Patrick Lagüe, Université Laval Solution: Utilisation d'une fonction mathématique qui ramènera les forces exercées par l'atome i à zéro entre les distances rc et rb (méthodes de troncation). Les méthodes de troncations (2) 4 méthodes mathématiques, applicables aux forces électrostatiques et de VdW: ➔ switch ➔ force switch ➔ shift ➔ force shift Pour le graphique, rc=8 et rb=12. Prendre la méthode la mieux adaptée pour le système étudié. Patrick Lagüe, Université Laval Article Peter Steinbach La liste des voisins Pour accélérer les calculs d'énergie intermoléculaire, une liste de voisins est constituée pour chaque atomes du système. Cette liste est rafraîchie régulièrement ou au besoin. Distance > Distance de troncation... rc rb i Distance liste de voisins Patrick Lagüe, Université Laval Erreurs causées par les troncations Patrick Lagüe, Université Laval Particle-mesh Ewald 3 étapes: ● ● ● La densité de charge du système étudié est approximée en assignant une charge sur une grille fine (~1Ang) dans la boîte. L'équation de Poisson est résolue à l'aide d'une FFT, pour obtenir le potentiel électrostatique causée par la distribution des charges sur la grille. Le champs est calculé pour chaque point de la grille en différenciant numériquement le potentiel, et la force sur chaque atome est calculée par interpolation du champs de la grille. L'utilisation de PMEwald minimise les effets causés par la troncation. Patrick Lagüe, Université Laval Les conditions périodiques frontières Lorsqu'on veut simuler un système à plusieurs molécules, il y a un problème à la frontière du système: ● les interactions intermoléculaires sont discontinuées ● que se passe-t-il avec les molécules en mouvement à la frontière? Solution: imposition de conditions périodiques aux frontières (periodic boundary conditions): Une boîte tridimensionnelle contenant nos molécules(système de base) + de chaque côté, des images virtuelles de ces molécules(répliques du sysème de base) Patrick Lagüe, Université Laval Différentes géométries de frontières Plusieurs géometries: Cubique Orthorombique Hexagonal Octahedral Tetrahedral Rhombique Dodecahedron Objectif: Minimiser le nombre de molécules de solvant tout en respectant la géométrie des molécules étudiées. Patrick Lagüe, Université Laval Les ensembles thermodynamiques Permet de simuler différents types de phénomènes physiques: NVE À l'origine du développement de la MD. Le nb d'atomes, le volume et l'énergie sont constants lors de la simulation. Très peu pratique pour simuler des systèmes biologiques. NVT La température est maintenue constante en changeant l'énergie du système. Pratique pour simuler un processus à la température de la pièce. NPT La pression est maintenue constante en changeant le volume du système. Se rapproche le plus de la “réalité” du laboratoire. N (Nb d'atomes) Patrick Lagüe, Université Laval V (Volume)E (Énergie) T (Température) P (Pression) Équilibration du système C'est la période critique de la simulation. Une mauvaise équilibration mène à de mauvais résultats, ou des résultats biaisés. 2 étapes: a) Réchauffement graduel du système, pour augmenter lentement son énergie cinétique. b) Relaxation des molécules, selon la composition: protéine/eau (~300ps), peptide/micelle (~500ps) ou peptide/bicouche (~1000-3000ps). Vérifier: La température (énergie cinétique), la valeurs des différents termes d'énergie,la conservation de l'énergie totale, ... Patrick Lagüe, Université Laval Production de la simulation Utilisation de “grappes” de PC (cluster) reliés entre eux par un réseau très rapide. C'est l'étape qui prend le plus de temps lors d'une simulation. Typiquement, un système composé de 25000 atomes prendra une semaine sur 16CPU pour calculer une trajectoire de 1ns. Patrick Lagüe, Université Laval Choisir la durée de simulation Dépend de plusieurs facteurs: - Temps requis pour l'équilibration. - Les temps de relaxation et de corrélation des différents composants de notre système. - L'échantillonage requis de nos observables physiques (exemples: énergie interne, tension interfaciale, chaleur spécifique,...). La durée de simulation doit être au moins aussi longue que la période de relaxation du procédé étudié. Patrick Lagüe, Université Laval Analyse de la trajectoire Qu'est-ce qu'on regarde? - Conservation/changement dans la structure de notre protéine? - Observables physiques: Densité, diffusion, transport d'ions, etc... - Les moyennes, les fluctuations, les temps de corrélation, RMSD, les paramètres d'ordre,... Il est préférable de déterminer avant le début de la simulation ce qui sera étudié, afin de déterminer la durée de la simulation, la fréquence à laquelle les coordonnées des atomes seront sauvegardées, etc... Patrick Lagüe, Université Laval Les approximations impliquées ● Le champ de force n'est qu'une approximation de la réalité. ● L'utilisation de distances de troncations. ● L'intégration numérique des équations comporte des approximations: ● Précision des calculs (nb de décimales: gromacs VS autres). ● Le Dt choisi aura une incidence sur les résultats. ● Utilisation de la série de taylor pour intégrer les équations du mouvement. V C'est pourquoi il est préférable d'utiliser les valeurs relatives lors de l'analyse des résultats de DM plutôt que les valeurs absolues. Patrick Lagüe, Université Laval