Optimisation dynamique en temps continu

publicité
Mathias André
École Polytechnique – Crest
M1 EPP 2009
Optimisation dynamique en temps continu
Fiche sur l’Hamiltonien - Économie de la croissance
Cette fiche s’appuie en grande partie sur l’annexe mathématique 3 de Barro, R. Sala-i-Martin, La croissance économique, McGraw Hill, 1995. Cette méthode s’appuie sur le principe du maximum en contrôle
optimal de L. Pontryagin généralisant le calcul des variations.
1
Problème type
L’agent économique cherche à maximiser une fonction objectif, ses décisions portant sur les variables
de contrôle. Les contraintes évoluent au cours du temps (contraintes dynamiques) : les variables d’état
permettent de décrire l’économie. Le problème type s’écrit sous la forme :
Z
ct
T
v[k(t), c(t), t]dt sous les contraintes :
max
(1)
0
k̇(t) = g[k(t), c(t), t]
k(0) = k0 > 0 fixé
k(T )e−r(T )T ≥ 0
r(T ) est un facteur d’escompte. La première contrainte est une équation d’accumulation qui traduit
l’influence du choix c(t) (variable de contrôle) sur l’évolution de k(t) (variable d’état). La deuxième fixe
la valeur initiale de la variable d’état (point de départ de l’économie) et la troisième tient compte du fait
qu’à la fin de la planification (à l’infini ou non) la variable d’état actualisée ne peut pas être négative
(par exemple, dette à la disparition de l’agent) ou doit croître à un taux inférieur à r(t).
2
Conditions du premier ordre
L’approche adoptée est heuristique (intuitive) et s’inspire du théorème de Kühn-Tucker. Il ne s’agit
donc pas d’une démonstration mais d’un parallèle explicatif avec le cas statique.
Par analogie, on définit le lagrangien associé à (1) :
Z
L=
T
Z
v[k(t), c(t), t]dt +
0
T
µt {g[k(t), c(t), t] − k̇(t)}dt + νk(T )e−r(T )T
(2)
0
µt est le multiplicateur dynamique de Lagrange associé à la contrainte d’accumulation, il correspond donc
au prix (ou à la valeur) d’une unité supplémentaire de stock de capital à t en unités d’utilité au temps
0. Dans le cas statique, on dérive le lagrangien en fonction de k(t) et c(t), ce qui ne peut être fait ici à
cause du k̇(t) ; l’idée est d’intégrer par parties le terme µt k̇(t) dans (2) qui fait apparaître l’Hamiltonien
du problème (ceci vaut donc pour définition) :
H(k, c, t, µ)
= v[k, c, t] + µt g[k, c, t]
tel que
Z T
L =
H(k(t), c(t), t, µt ) + µ̇(t)k(t)dt + µ(0)k0 − µ(T )k(T ) + νk(T )e−r(T )T
(3)
(4)
0
L’interprétation économique de l’Hamiltonien est la suivante : à un instant t donné l’agent consomme c(t)
et possède k(t). Son choix c(t) affecte directement l’utilité par le premier terme mais aussi indirectement
avec le second. La décision c(t) contribue à faire évoluer k(t) par la contrainte d’accumulation (cette
variation vaut g[k(t), c(t), t]) et ceci au prix implicite µt . Ainsi, l’Hamiltonien traduit la contribution
totale à l’utilité du choix c(t).
1
Pour obtenir les conditions du premier ordre « habituelles » concernant les sentiers temporels optimaux de k et c, l’idée est de définir une perturbation ε autour de l’équilibre (C∗, K∗, KT∗ ) telle que :
c(t) = C ∗ + εp1 (t)
k(t) = K ∗ + εp2 (t)
Après avoir écrit le lagrangien en fonction de ε, on annule
Après réangement et avec (4) on obtient :
∂L
=
∂ε
Z
T
{
0
∂L
∂ε
k(T ) = KT∗ + εdk(T )
pour que les trajectoires soient optimales.
∂H
∂H
p1 (t) + (
+ µ̇)p2 (t)}dt + (νk(T )e−r(T )T − µ(T ))dk(T )
∂c
∂k
Cette dernière expression devant être valable pour toutes perturbations p1 , p2 et dk, on en déduit les
trois relations appelées conditions du premier ordre :
∂H
∂c
∂H
∂k
νk(T )e−r(T )T
=
0
(5)
= −µ̇
(6)
= µ(T )
(7)
Autrement exprimé : la dérivée de l’Hamiltonien par rapport aux variables de contrôle est nulle et pour les
variables d’état, est égale à l’opposé de la variation du multiplicateur de Lagrange associé. Ceci recoupe
l’interprétation économique de l’Hamiltonien en terme de variation globale d’utilité.
3
Conditions de transversalité
Dans le cas de l’horizon fini, la dernière relation permet d’arriver à l’équation (en utilisant la troisième
et dernière contrainte) dite condition de transversalité :
µ(T )k(T ) = 0
(8)
Pour l’interpréter, on distingue les deux cas suivants :
– k(T ) > 0 : la quantité de capital détenu est positive en fin de période, son prix doit être nul
µ(T ) = 0
– µ(T ) ≥ 0 : à l’inverse, si sa valeur est positive, l’agent ne peut en détenir.
4
Evolution du Hamiltonien et conditions suffisantes
En dérivant la valeur optimale du Hamiltonien par rapport au temps, on obtient :
dH
∂H
∂H
∂H
∂H
=
ċ +
k̇ +
µ̇ +
dt
∂c
∂k
∂µ
∂t
∂H
En utilisant les conditions du premier ordre (7), cela devient dH
dt = ∂t , qui s’annule donc dans le cas où
le Hamiltonien ne dépend pas explicitement du temps (problème autonome). Dans le cas autonome, le
Hamiltonien est donc stationnaire à l’optimum.
e
Brièvement : on définit H(k,
µ, t) le maximum en c de H(k, c, µ, t). Le théorème de Arrow-Wurz
e
assure que si H est concave en k, alors les conditions nécessaires sont aussi suffisantes.
5
Horizons infinis
Cette section correspond au cas où T = ∞. Les résultats sont identiques en transformant formellement
T en +∞ et en remplaçant les égalités en T par des limites. Par exemple, la condition de transversalité
s’écrit :
lim µt k(t) = 0
(9)
+∞
2
Les interprétations économiques sont aussi semblables en raisonnant asymptotiquement. Cependant
l’équation (9) ne fait pas l’unanimité dans la littérature comme condition nécessaire (elle ne s’applique
pas toujours, Halkins(1974) ayant trouvé un contre-exemple). Michel (1982) a montré qu’une condition
de transversalité toujours nécessaire est lim+∞ H(t) = 0 qui est une conséquence de (9) (donc moins
contraignante). Nous plaçons très majoritairement dans les cas où (9) est nécessaire ; ce qui est vérifié
en présence d’un facteur d’escompte dans l’utilité (du type préférence pour le présent).
6
Récapitulatif pour exprimer les conditions du premier ordre
En résumé la démarche à adopter est la suivante :
1. écrire le Hamiltonien : H = v(k, c, t) + µt g(k, c, t)
2. annuler la dérivée par rapport à la variable de contrôle :
∂H
∂c
=0
3. égaliser l’opposé de la dérivée par rapport à la variable d’état et la variation temporelle du multiplicateur associé : ∂H
∂k = −µ̇
4. pour la condition de transversalité on distingue les trois cas suivants
– horizons finis : µ(T )k(T ) = 0
– horizons infinis avec facteur d’escompte : lim+∞ µt k(t) = 0
– horizons infinis sans facteur d’escompte : lim+∞ H(t) = 0
Les deux premiers points ajoutés à la contrainte d’accumulation sur k̇ permettent d’obtenir un système
à deux équations différentielles en µ et k (on peut aussi raisonner en c et µ). La condition initiale est k0
et une condition terminale est fournit par la condition de transversalité.
7
Variables multiples
La démarche précédente s’adapte parfaitement au cas à plusieurs variables. Avec n variables d’état
et p variables de contrôle, nous obtenons les conditions du premier ordre :
∂H
= 0 pour i = 1 . . . p
∂ci
∂H
= −µ̇i pour i = 1 . . . n
∂ki
µi (T )ki (T ) = 0 pour i = 1 . . . n
8
(10)
(11)
(12)
Hamiltonien et facteur d’escompte : valeurs courante et actualisée
Dans le cas où la fonction objectif s’écrit avec facteur d’escompte (ρ est le taux d’escompte, supposé
constant) :
Z T
e−ρt u[k(t), c(t)]dt
0
−ρt
Le Hamiltonien s’écrit : H(k, c, t, µ) = e u[k, c, t] + µt g[k, c, t] où µ représente le prix implicite de k(t)
en unité d’utilité initiale. Il peut être utile de raisonner en valeur courante. Pour ce faire, on définit
Ĥ = eρt H = u[k, c, t] + q(t)g[k, c, t] avec q(t) = eρt µ(t). Les conditions du premier ordre sont inchangées :
Hc = 0 et Hk = −µ̇ ; ce qui donne :
Ĥc = 0
Ĥk = ρq − q̇
La condition de transversalité s’écrit ainsi :
e−ρT q(T )k(T ) = 0
Tout ceci s’interprète comme la fixation du prix d’un actif vue en TD.
3
Téléchargement