Série de lectures sur la Dynamique Moléculaire:

publicité
Série de lectures sur la Dynamique Moléculaire:
●
●
Application pratique (boîte d'eau)
●
Patrick Lagüe, Université Laval
Concepts Théoriques
Méthodes de solvant implicite
Les outils de modélisation moléculaires
Analogie avec les modèles de plastique:
La version électronique permet d'aller plus loin:
●
●
●
Patrick Lagüe, Université Laval
Calculs d'énergie
Explorer l'espace conformationnel
Étudier la dynamique des molécules
Avantages et désavantages
Avantages:
●
Description atomique des molécules.
●
Suivi complet de la dynamique des molécules (diffusion, orientation, ...).
●
Utilisation des conditions physiologiques (marqueurs, etc...).
Désavantages:
●
Beaucoup d'informations à gérer (utilisation d'environ 25000 atomes).
●
Méthode lente (semaines, mois).
●
Échelle de temps accessible de l'ordre de 10-100 ns.
●
Plusieurs approximations sont impliquées (détails plus loin).
Patrick Lagüe, Université Laval
Débuts de la DM
●
Fin des années 50, par B.J. Alder et T. E. Wainwright.
●
Jusqu'à 500 boules dures modélisant des particules.
●
Pour étudier les différents états de la matière (solide, liquide, gaz).
●
Les résultats sont comparés avec les résultats “théoriques” et
expérimentaux.
Ce sont des expériences effectuées à l'aide d'un ordinateur!
(J. Chem. Phys. 27, 1208 (1957); J. Chem. Phys. 31, 459 (1959)).
Patrick Lagüe, Université Laval
Autres étapes importantes
En 1964:
A. Rahman simule de l'argon liquide avec un potentiel de LennardJones.
(Phys. Rev. A 136, 405 (1964))
En 1974:
Simulation de DM de l'eau liquide donnant des résulats
comparables
aux résultats expérimentaux.
(Stillinger, F. H. and Rahman, A. J. Chem. Phys. 60, 1545 (1974))
Patrick Lagüe, Université Laval
Première simulation d'une protéine
●
En 1977, par J.A. McCammon, B.R. Gelin et M. Karplus.
●
L'inhibiteur de la trypsine du pancréas de boeuf (BPTI).
●
58 acides aminés et 4 molécules d'eau.
●
Durée de la simulation 3.2 ps (3.2 x 10-12 sec.)
●
Les protéines bougent!
(Nature (Lond.) 267, 585 (1977))
Patrick Lagüe, Université Laval
La base: L'équation du mouvement
La seconde loi de Newton (1687) décrit la relation entre
la force et l'accélération pour une particule:
Force = Masse x Accélération
En termes mathématiques:
F i =mi ai
Cette équation est aussi reliée à la vitesse et à la position de la particule:
2
d vi
d ri

F i =mi ai =mi
=mi
dt
d t2
Si on connait la force appliquée sur une particule, on peut prédire sa position dans le temps!
Patrick Lagüe, Université Laval
Le champ de forces
Décrit les interactions entre les différentes particules lors de la simulation.
=
F
−dE pot  r 
d r
où Epot est l'énergie potentielle des molécules.
Cette énergie potentielle est calculée à l'aide d'une fonction d'énergie
potentielle empirique (description mathématique), communément appelée
Champ de Forces.
Deux critères sont à considérer pour un bon champ de forces:
● Rapide à calculer.
● Reproduire les données expérimentales et les calculs de chimie
quantique.
Patrick Lagüe, Université Laval
Décomposition du champ de force
L'énergie potentielle se décompose en trois termes:
Epot = Einterne + Eexterne + Econtraintes
L'énergie interne est associée à la déformation de la molécule:
Einterne = Eliaison + Eangle + Eimpropre+ Etorsion
L'énergie externe est l'énergie d'interaction avec les autres molécules:
Eexterne = Evdw + Eélectrostatique + ElienH
L'énergie des contraintes est l'énergie imposée pour satisfaire une contrainte
(ex.: distance fixe entre deux atomes).
Patrick Lagüe, Université Laval
Eliaison
Potentiel harmonique (loi de Hook):
2
E liaison =k liaison d −d 0 
Décrit la variation d'énergie lorsque la longueur du lien entre deux atomes
varie de la position d'équilibre d0:
Énergie de liaison C-C
450
d
Énergie (kcal/mol)
400
350
300
250
200
150
100
50
0
0.5
0.7
0.9
1.1
1.3
d (Ang)
Patrick Lagüe, Université Laval
1.5
1.7
1.9
2.1
Eangle
Potentiel harmonique (loi de Hook):
2
E angle =k angle −0 
Décrit la variation d'énergie lorsque l'angle entre 3 atomes liés varie de
sa position d'équilibre:
Energie d'un angle C-C-C
500

Energie (kcal/mol)
450
400
350
300
250
200
150
100
50
0
105
106
107
108
Angle (degres)
Patrick Lagüe, Université Laval
109
110
111
Eimpropre
●
Permet de maintenir la chiralité de certaines molécules.
●
Permet de tenir plan des groupements contenant des électrons délocalisés.
●
Présent surtout au niveau du squelette des peptides et des protéines.
Potentiel harmonique:
2
E impropre =k impropre −0 
Energie selon l'angle impropre HCCH
500

Energie (kcal/mol)
450
400
350
300
250
200
150
100
50
0
-5
-4.5
-4
-3.5
-3
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
Angle (degreés)
Patrick Lagüe, Université Laval
1.5
2
2.5
3
3.5
4
4.5
5
Etorsion
Pour décrire les différentes conformations accessibles par une molécule.
E torsion =k torsion 1cosn −

Energie (kcal/mol)
Energie de torsion pour CCCC
0.325
0.3
0.275
0.25
0.225
0.2
0.175
0.15
0.125
0.1
0.075
0.05
0.025
0
cis
trans
-200
-150
-100
-50
0
50
Angle (degres)
Patrick Lagüe, Université Laval
100
150
200
Evdw
Les atomes espacés de moins de 2 liens ne participent pas aux interactions.
Énergie intermoléculaire attractive et répulsive.
Potentiel de Lennard-Jones:
12
6
r0
r0
E vdw =[  −2  ]
r
r
Potentiel de LJ entre deux atomes de carbone
4.8
4.3
Énergie (kcal/mol)
3.8
3.3
2.8
2.3
1.8
1.3
0.8
0.3
-0.2
0
10
r (Angstrom)
Patrick Lagüe, Université Laval
Eelectrostatique
Les charges sont modélisées par un point à la position de l'atome (point-charge).
➔ Signifie aucune polarisabilité (déformation de nuage électronique).
Potentiel de Coulomb:
qi q j
E elec =
4 r
Potentiel de Coulomb
3.5
3
2.5
-
2
1.5
Energie
+
-
+
Repulsion
1
0.5
0
-0.5
Attraction
-1
-1.5
-2
0
1
2
3
4
5
6
7
8
r (angstrom)
Les atomes espacés de moins de 2 liens ne participent pas aux interactions.
Patrick Lagüe, Université Laval
ElienH
2 philosophies différentes:
1) Présents de façon explicite:
E lienH =[
C
D
−
]
12
10
r
r
2) Balance entre Evdw et Eelectrostatique (plus courant et plus rapide).
Patrick Lagüe, Université Laval
Econtraintes
Diverses contraintes peuvent être appliquées, lorsque des paramètres
expérimentaux sont connus:
●
Distances inter-protons.
●
Angles dihèdres.
●
Ponts hydrogènes.
●
Orientations de liens.
●
Etc...
Aussi utilisé lors de l'équilibration des systèmes (détails plus loin).
Patrick Lagüe, Université Laval
Intégration de l'équations du mouvement
2
−dE pot  r 
d
r

= F =m 2
L'équation de mouvement:
d r
dt
Pour obtenir la force appliquée sur un atome, il ne suffit que de dériver
l'énergie potentielle (facile, méthode analytique).
Pour obtenir la position en fonction du temps, il faut intégrer la force:
2
2

∬ F dt =∬ m d r
(difficile, pas de méthode analytique)
Vieux proverbe mathématique: “Dérive qui veut, intègre qui peut!”
Patrick Lagüe, Université Laval
Comment résoudre les intégrales
Méthode de Verlet (leap frog): (D'autres méthodes existes: Velocity Verlet,etc...)
Décomposition du temps en intervalle Dt très courts.
Calcul de la vitesse et de la position suivant une équation tirée
d'une série de Taylor pour résoudre les équations de mouvement.
Pour la vitesse:
Fx
1
1
v x t   t =v x t −  t  t
t 
2
2
m
Pour la position
1
2 Fx
x t  t = x t  t v x t   t
t 
2
m
où
1
1
1
v x t = [ v x t −  t v x t   t ]
2
2
2
Patrick Lagüe, Université Laval
Diagramme d'une simulation
Coordonnées initiales
Minimisation du système
Assigner les vélocités initiales
Équilibration
Production de la trajectoire
Analyse des résultats
Patrick Lagüe, Université Laval
Dynamique
Coordonnées initiales
2 méthodes:
●
Utiliser une structure déterminée expérimentalement (PDB).
ou
●
Placer les atomes/molécules dans une géométrie se rapprochant
le plus de ce qu'on connaît expérimentalement (ex. bicouche lipidique).
La seconde méthode nécessite habituellement une bonne minimisation.
Patrick Lagüe, Université Laval
Minimisation
Pourquoi?
Parce que la plupart du temps les molécules du système
ne sont pas dans une géométrie d'énergie minimale.
De telles géométries ont pour conséquence d'engendrer des forces
considérables, et l'intégration de ces forces devient “instable”:
- la dynamique “plante”, explose, etc...
Un bon système de départ possède une géométrie ayant
une énergie minimisée:
Patrick Lagüe, Université Laval
Méthodes de minimisation
4 Méthodes mathématiques pour trouver le minimum d'énergie:
● Descente abrupte (Steepest Descent)
● Gradient conjugué (Conjugate Gradient)
● Newton-Raphson
● Newton-Raphson à base adaptée (Adapted Basis Newton-Raphson)
2 Méthodes sont préférées pour les gros systèmes:
● SD: calcul rapide, efficace pour minimiser les mauvais
contacts atomiques, converge mal près d'un minimum.
● ABNR: calcul plus lent, converge mal loin d'un minimum, converge
bien près d'un minimum.
Truc: alterner les méthodes pour utiliser les
avantages de chacune, et se rapprocher du
minimum global.
Patrick Lagüe, Université Laval
Assigner les vitesses initiales
Cette étape est requise par les intégrateurs puisque ces derniers se basent sur
la vitesse précédente pour calculer la vitesse suivante.
F
Les vitesses sont assignées au hasard, selon une distribution gaussienne
ou uniforme, en respectant le théorème d'équipartition (relie la vitesse
des atomes à la température):
1
3
2
m v = Nk b T
2
2
Si la dynamique est bien équilibrée, la méthode utilisée pour initialiser les
vitesses n'aura pas d'impact sur les résultats.
Patrick Lagüe, Université Laval
La dynamique et ses paramètres
Liste des paramètres (entre autres):
Patrick Lagüe, Université Laval
●
Timestep (Δt).
●
Les distances et méthodes de troncations.
●
Les conditions périodiques frontières.
●
Particle-Mesh Ewald
●
Les ensembles thermodynamiques.
Comment choisir un timestep?
Selon la fréquence de vibration la plus rapide des molécules étudiées.
Pour les systèmes biologiques, c'est la fréquence vibrationnelle des liens
hydrogènes qui sont les plus rapides (10-14 secondes).
Pour assurer une bonne intégration des équations de mouvements,
le timestep idéal doit être 1/10 de cette fréquence, soit 1fs.
Il existe certains astuces permettant d'employer un timestep plus grand,
mais dans ce cas la dynamique des molécules est remise en question.
Patrick Lagüe, Université Laval
Les distances de troncations (1)
Le nombre approximatif d'interactions à calculer pour un système
d'environ 22000 atomes:
Énergie interne:
● 22000 liens,
● 10300 angles,
● 5300 angles de torsions et
● 400 angles impropres.
Énergie inter-moléculaire:
● ½ n(n-1) pour les interactions VdW (~242 millions).
● ½ n(n-1) pour les interactions électrostatiques (~242 millions).
Patrick Lagüe, Université Laval
Les distances de troncations (2)
Passé une certaine distance, les forces intermoléculaires sont négligeables:
Potentiel de Coulomb
Potentiel de LJ
3.5
3
2.5
1.55
2
1.3
1.5
Energie
Energie (kcal/mol)
1.8
1.05
0.8
Repulsion
1
0.5
0
-0.5
0.55
Attraction
-1
0.3
-1.5
0.05
-2
0
-0.2
0
10
1
2
3
4
5
6
7
8
r (angstrom)
r (Angstrom)
Pour accélérer les calculs, les interactions entre atomes espacés
d'une certaine distance sont négligés.
rc
i
Cette distance est appelée la distance de troncation rc (cutoff).
Patrick Lagüe, Université Laval
Les méthodes de troncations (1)
Même si les forces sont petites passé la distance de troncation, elles existent.
Effet collectif important sur plusieurs milliers d'atomes.
Une coupure radicale des forces à la distance de troncation a pour effet
d'introduire des artefacts dans les interactions moléculaires
● mauvaises densités.
● mauvaises distributions moléculaires.
rc
rb
i
Patrick Lagüe, Université Laval
Solution: Utilisation d'une fonction mathématique qui
ramènera les forces exercées par l'atome i à zéro
entre les distances rc et rb (méthodes de troncation).
Les méthodes de troncations (2)
4 méthodes mathématiques, applicables aux forces
électrostatiques et de VdW:
➔ switch
➔ force switch
➔ shift
➔ force shift
Pour le graphique, rc=8 et rb=12.
Prendre la méthode la
mieux adaptée pour le
système étudié.
Patrick Lagüe, Université Laval
Article Peter Steinbach
La liste des voisins
Pour accélérer les calculs d'énergie intermoléculaire, une liste
de voisins est constituée pour chaque atomes du système.
Cette liste est rafraîchie régulièrement ou au besoin.
Distance > Distance de troncation...
rc
rb
i
Distance liste de voisins
Patrick Lagüe, Université Laval
Erreurs causées par les troncations
Patrick Lagüe, Université Laval
Particle-mesh Ewald
3 étapes:
●
●
●
La densité de charge du système étudié est approximée en
assignant une charge sur une grille fine (~1Ang) dans la boîte.
L'équation de Poisson est résolue à l'aide d'une FFT, pour obtenir
le potentiel électrostatique causée par la distribution des charges
sur la grille.
Le champs est calculé pour chaque point de la grille en
différenciant numériquement le potentiel, et la force sur chaque
atome est calculée par interpolation du champs de la grille.
L'utilisation de PMEwald minimise les effets causés par la troncation.
Patrick Lagüe, Université Laval
Les conditions périodiques frontières
Lorsqu'on veut simuler un système à plusieurs molécules, il y a un problème
à la frontière du système:
● les interactions intermoléculaires sont discontinuées
● que se passe-t-il avec les molécules en mouvement à la frontière?
Solution: imposition de conditions périodiques aux frontières
(periodic boundary conditions):
Une boîte tridimensionnelle contenant nos molécules(système de base)
+
de chaque côté, des images virtuelles de ces molécules(répliques du sysème de base)
Patrick Lagüe, Université Laval
Différentes géométries de frontières
Plusieurs géometries:
 Cubique
 Orthorombique
 Hexagonal
 Octahedral
 Tetrahedral
 Rhombique Dodecahedron
Objectif: Minimiser le nombre de molécules
de solvant tout en respectant
la géométrie des molécules étudiées.
Patrick Lagüe, Université Laval
Les ensembles thermodynamiques
Permet de simuler différents types de phénomènes physiques:
NVE
À l'origine du développement de la MD. Le nb d'atomes, le volume
et l'énergie sont constants lors de la simulation. Très peu pratique
pour simuler des systèmes biologiques.
NVT
La température est maintenue constante en changeant l'énergie du
système. Pratique pour simuler un processus à la température de la
pièce.
NPT
La pression est maintenue constante en changeant le volume du
système. Se rapproche le plus de la “réalité” du laboratoire.
N (Nb d'atomes)
Patrick Lagüe, Université Laval
V (Volume)E (Énergie) T (Température)
P (Pression)
Équilibration du système
C'est la période critique de la simulation. Une mauvaise équilibration mène
à de mauvais résultats, ou des résultats biaisés.
2 étapes:
a) Réchauffement graduel du système, pour augmenter lentement son
énergie cinétique.
b) Relaxation des molécules, selon la composition:
protéine/eau (~300ps), peptide/micelle (~500ps) ou
peptide/bicouche (~1000-3000ps).
Vérifier: La température (énergie cinétique), la valeurs des différents
termes d'énergie,la conservation de l'énergie totale, ...
Patrick Lagüe, Université Laval
Production de la simulation
Utilisation de “grappes” de PC (cluster) reliés entre
eux par un réseau très rapide.
C'est l'étape qui prend le plus de temps lors d'une simulation.
Typiquement, un système composé de 25000 atomes prendra
une semaine sur 16CPU pour calculer une trajectoire de 1ns.
Patrick Lagüe, Université Laval
Choisir la durée de simulation
Dépend de plusieurs facteurs:
- Temps requis pour l'équilibration.
- Les temps de relaxation et de corrélation des différents
composants de notre système.
- L'échantillonage requis de nos observables physiques (exemples:
énergie interne, tension interfaciale, chaleur spécifique,...).
La durée de simulation doit être au moins aussi longue que la période
de relaxation du procédé étudié.
Patrick Lagüe, Université Laval
Analyse de la trajectoire
Qu'est-ce qu'on regarde?
- Conservation/changement dans la structure de notre protéine?
- Observables physiques:
Densité, diffusion, transport d'ions, etc...
- Les moyennes, les fluctuations, les temps de corrélation, RMSD,
les paramètres d'ordre,...
Il est préférable de déterminer avant le début de la simulation ce qui sera étudié,
afin de déterminer la durée de la simulation, la fréquence à laquelle les
coordonnées des atomes seront sauvegardées, etc...
Patrick Lagüe, Université Laval
Les approximations impliquées
●
Le champ de force n'est qu'une approximation de la réalité.
●
L'utilisation de distances de troncations.
●
L'intégration numérique des équations comporte des approximations:
●
Précision des calculs (nb de décimales: gromacs VS autres).
●
Le Dt choisi aura une incidence sur les résultats.
●
Utilisation de la série de taylor pour intégrer les
équations du mouvement.
V
C'est pourquoi
il est préférable d'utiliser les valeurs relatives lors de
l'analyse des résultats de DM plutôt que les valeurs absolues.
Patrick Lagüe, Université Laval
Téléchargement