Chap 7 : Le cas multivarié

publicité
Chapitre 7 : Le cas multivarié
1. Processus stochastiques multivariés
 y1t 
y 
2t
Soit y t   
 ... 
 
 y kt 
un vecteur de k variables d’intérêt . On peut citer plusieurs exemples intéressants : i.
consommation revenu; ii. taux d’intérêt à court terme et à long terme; iii. monnaie,
revenu et taux d’intérêt, etc. On sait que la matrice de variance covariance de yt (de
dimension k x k) est donnée par
Cov (yt yt-j ) = (j)
j=0,1,2, ...
Dans le cas k=2,
 ( j )  12 ( j ) 
( j )   11

 21 ( j )  22 ( j )
j=0,1,2
2. Le modèles VAR : formulation et stationnarité.
Formulation
Le modèle AR(1) univarié postule une relation entre yt et yt-1. Son pendant multivarié
VAR(1) procède de la même façon. Chaque variable sera reliée à chacune des autres
variables retardées. Si k=2,
y1,t = 1 + 11 y1,t-1 + 12 y2,t-1 + v1t
y2,t = 2 + 21 y1,t-1 + 22 y2,t-1 + v2t
où E(v1t2) = 11 , E(v2t2) = 22 et E(v1t v2t) = 12 .
En notation matricielle,
 y1t   1  11 12   y1t 1   v1t 
 y     
 

 2t   2   21 22   y 2t 1  v2t 
yt =  + yt-1 + vt
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
1
 

où E(vt vt’) =  =  11
.


22 
 21
Dans le cas d’un VAR(2), on a
y1,t = 1 + 11,1 y1,t-1 + 11,2 y1,t-2 + 12,1 y2,t-1 + 12,2 y2,t-2 + v1t
y2,t = 2 + 21,1 y1,t-1 + 21,2 y1,t-2 + 22,1 y2,t-1 + 22,2 y2,t-2 + v2t
En notation matricielle,
 y1t  11,1 12,1   y1t 1  11,2 12,2   y1t 2   v1t 
  y   
  y   v 
 y   


21
,
1
22
,
1
21
,
2
22
,
2
 2t  
  2t 1  
  2 t 2   2 t 
yt =  + 1yt-1 + 2yt-2 + vt
 

où E(vt vt’) =  =  11
.
 21  22 
Dans la cas général, on écrit
yt =  + 1yt-1 + 2yt-2 + ... + pyt-p + vt
où j sont des matrices de dimension k x k.
Tout comme dans le cas univarié, on peut toujours écrire un modèle VAR(p) sous la
forme d’un super modèle VAR(1)
yt =  + yt-1 + vt .
Propriétés
Supposons le modèle VAR(1) sans constante suivant (s’il n’y a pas de constante, la
moyenne est zéro) :
yt = yt-1 + vt
0 = E yt yt’
0
0
= E[(yt-1 + vt)( yt-1 + vt)’]
= E[yt-1yt-1’’ + ... + vt vt’]
= E(yt-1yt-1’)’ + ... + E(vt vt’)
= 0’+ 
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
2
1 = E yt yt-1’ = E[(yt-1 + vt)( yt-1)’]
=  E(yt-1yt-1’)
= 0
j = j-1 = j0
Stationnarité
On peut décomposer la matrice  en
 = CC-1
où  correspond à la matrice des racines caractéristiques.
j = j0 = CjC-10.
Le modèle VAR(1) avec k=2 sera stationnaire si les racines caractéristiques sont à
l’intérieur du cercle unité (voir VAR1.PRG). Le même raisonnement s’applique au
VAR(p) de dimension k mais on calcule rarement ces conditions dans la pratique ... on
s’y prend d’une autre façon! En calculant la représentation moyenne mobile par exemple
... car elle doit absolument converger vers 0 dans le cas stationnaire. On conviendra qu’il
s’agit d’une approche beaucoup plu simple.
3. Estimation et choix de p
Estimation
On peut estimer chacune des k équations du modèle VAR(p) à l’aide des MC. On peut
montrer que les mêmes propriétés que si on avait utilisé des méthodes plus sophistiquées
qui tiennent compte de la covariance entre les termes d’erreurs (SUR).
Choix de p
Le choix du retard maximal p se fait un peu comme dans le cas univarié avec, bien sûr,
quelques ajustements. L’approche la plus utilisée est sans aucun doute le test de rapport
de vraisemblance qui demande très peu d’adaptations. Ainsi, supposons le test suivant :
H0 : VAR(2)
H1 : VAR(4).
Il faut tout d’abord estimer chacune des équations sous H1, i.e. un VAR(4) à l’aide des

MC, sauvegarder les résidus et calculer la matrice de variance covariance  NC qui

correspond en quelque sorte à la variance  NC dans le cas du AR univarié. Il faut ensuite
estimer chacune des équations sous H0, i.e. un VAR(2) à l’aide des MC, sauvegarder les
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
3

résidus et calculer la matrice de variance covariance  C . Le test de rapport de
vraisemblance dans le cas multivarié est donné par


RV = T [log |  NC | - log |  C | ] qui suit une X2(q)
où | .| correspond à l’opérateur déterminant et q représente le nombre de restrictions.
Dans le cas qui nous intéresse avec k=4, q= 4*4*2=32, i.e. j’impose 8 coefficients égaux
à 0 pour chacune des 4 équations d’où 32 restrictions. Le rôle de l’opérateur déterminant


est de transformer les matrices  NC et  C en scalaires selon une approche assez
intuitive. Ainsi,



 12 12 
2 2 2
| C | =  
 2  = 1  2  12
 21  2 


car 12   21 .
On constate que le déterminant sera d’autant plus petit (donc le modèle performant) si les
deux variances estimées, qui entrent de façon multiplicative dans le calcul du
déterminant, sont petites. Il faut bien sûr tenir compte de la covariance qui viendra
réduire encore plus le résultat si elle est positive.
Il existe aussi une version multivariée du critère d’Akaike qui est donnée par

AIC = T log |  | + 2 (k2*p)
où k2*p est le nombre de paramètres estimés dans un VAR(p) de dimension k.
4. Représentation moyenne mobile
Soit le modèle VAR(1)
yt = yt-1 + vt
où yt et vt sont des vecteurs (2x1) et  est une matrice de paramètres (2x2). On cherche
la représentation moyenne mobile
yt = vt + 1vt-1 + 2vt-2 + 3vt-3 + ...
où les matrices j (j=1,2,...) sont de dimension (2x2). Plus spécifiquement
 11,1  12,1 
1  

 21,1  22,1 
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
4
Ainsi, 12,1 correspond l’impact d’un choc v2t sur la variable y1 après 1 période. De
façon plus générale, ik,j correspond l’impact d’un choc vkt sur la variable yi après j
périodes. Pour trouver la représentation moyenne mobile d’un modèle VAR, pas
question de procéder à des dérivations analytiques compliquées : l’approche numérique
s’avère beaucoup plus simple ... surtout avec la commande IMPULSE de RATS. Ainsi
y1,t = 0,5 y1,t-1 + 0,2 y2,t-1 + v1t
y2,t = -0,2 y1,t-1 + 0,5 y2,t-1 + v2t
Supposons le scénario v1t=1 pour t=1 et v1t=0 pour tous les autres t et v2t=0 pour tous les
t.
Pour t=1
1 = 0,5 (0) + 0,2 (0) + 1
0 = -0,2 (0) + 0,5 (0) + 0
Pour t=2
0,5 = 0,5 (1) + 0,2 (0) + 0
-0,2 = -0,2 (1) + 0,5 (0) + 0
11,1
21,1
Pour t=3
11,2
21,2
0,21 = 0,5 (0,5) + 0,2 (-0,2) + 0
-0,2 = -0,2 (0,5) + 0,5 (-0,2) + 0
Supposons le scénario v2t=1 pour t=1 et v2t=0 pour tous les autres t et v1t=0 pour tous les
t.
Pour t=1
0 = 0,5 (0) + 0,2 (0) + 0
1 = -0,2 (0) + 0,5 (0) + 1
Pour t=2
0,2 = 0,5 (0) + 0,2 (1) + 0
0,5 = -0,2 (0) + 0,5 (1) + 0
12,1
22,1
Pour t=3
0,20 = 0,5 (0,2) + 0,2 (0,5) + 0
0,21 = -0,2 (0,2) + 0,5 (0,5) + 0
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
12,2
22,2
5
5. Prévisions et variance de l’erreur de prévision
y*1,T+h = 11 y*1,T+h-1 + 12 y*2,T+h-1
y*2,T+h = 21 y*1,T+h-1 + 22 y*2,T+h-1
Pour h=1
y*1,T+1 = 11 y1,T + 12 y2,T
y1,T+1- y*1,T+1 = v1,T+1 = v*1,T+1
et Var(v*1,T+1) = 11
Pour h=2
y*1,T+2 = 11 y*1,T+1 + 12 y*2,T+1
e*1,T+2 = y1,T+2- y*1,T+2
= 11 y1,T+1 + 12 y2,T+1 + v1,T+2 - 11 y*1,T+1 - 12 y*2,T+1
= v1,T+2 + 11 (y1,T+1- y*1,T+1) + 12 (y2,T+1- y*2,T+1)
= v1,T+2 + 11v1,T+1 + 12v2,T+1
Var(e*1,T+2)
= E(v1,T+2 + 11v1,T+1 + 12v2,T+1)( v1,T+2 + 11v1,T+1 + 12v2,T+1)
= E( [v1,T+2]2 + [11v1,T+1]2 + [12v2,T+1]2 + 21112v1,T+1v2,T+1 + …..)
= 11+ 11211 + 12222 + 2111212
Dans le cas général matriciel
v*T+h = vT+h + 1vT+h-1 + 2vT+h-2 + …h-1vT+1
Var(v*T+h)
= E[(vT+h + 1vT+h-1 + 2vT+h-2 + …h-1vT+1) (.)’]
=  + 11’ + … + h-1h-1’
Pour h=1
Var(v*T+1) = 
Pour h=2
Var(v*T+2) =  + 11’
etc.
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
6
6. Impulse et décomposition de variance
Revenons au modèle AR(1) simple où
yt =  +  yt-1 + et
et
yt = et + 1et-1 + 2et-2 + 3et-3 + ...
La variance de yt vient essentiellement du fait que cette série est en fait une combinaison
linéaire de chocs (tous de variance égale à 2) qui ont un effet décroissant. Plus
spécifiquement, dans le cas du AR(1) où j = j
Var(yt) = 2(1 + (2)1 + (2)2 + (2)3 …) = 2/(1-2).
Intéressons-nous maintenant à la question suivante : quelle proportion de la variance de
yt est-elle attribuable au trois premiers chocs? La réponse peut être trouvée facilement à
l’aide des formules données ci-dessus. Plus spécifiquement, il s’agit de regarder la
contribution des chocs et , et-1 et et-2 à la variance totale i.e.
 2 (1   2  ( 2 ) 2 )
= x%
2
2
1
Dans un modèle multivarié, la question naturelle à poser est beaucoup plus intéressante.
Mais avant notons que la représentation moyenne mobile de la première variable y1t d’un
modèle VAR de deux variables :
y1t = v1t + 11,1v1,t-1 + 12,1v2,t-1 + 11,2v1,t-2 + 12,2v2,t-1 …
La variance de yt vient essentiellement du fait que cette série est en fait une combinaison
linéaire de chocs v1t et v2t qui ont un effet décroissant. Sous l’hypothèse que E(v1t v2t) =0
i.e. la matrice de variance-covariance  est diagonale
Var(y1t ) = 11 + (11,1)211 + (12,1)222 + (11,2)211 + (12,2)222 …
Cette dernière formulation est l’ingrédient essentiel pour construire la variance d’une
erreur de prévision pour un horizon h. Ainsi, pour un horizon h=2
Var(e*1,T+2) = 11+ 11,1211 + 12,1222
dont 11+ 11,1211 est attribuable à des chocs v1t i.e. des chocs propres à la variable y1.
Le pourcentage de la variance de l’erreur de prévision de y1 attribuable à des chocs v1t
est donné par (11+ 11,1211)/ (11+ 11,1211 + 12,1222) et pourcentage de la variance
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
7
de l’erreur de prévision de y1 attribuable à des chocs v2t est donné par (12,1222)/ (11+
11,1211 + 12,1222).
La commande ERRORS du programme RATS calcule automatiquement ces statistiques
importantes.
ERRORS(IMPULSE) 2 6
# 1
# 2
Responses to Shock in Y1
Entry
1
2
3
4
5
6
Y1
1.000000000000
0.500000000000
0.210000000000
0.065000000000
0.004100000000
-0.014750000000
Y2
0.000000000000
-0.200000000000
-0.200000000000
-0.142000000000
-0.084000000000
-0.042820000000
Responses to Shock in Y2
Entry
1
2
3
4
5
6
Y1
Y2
0.0000000000000 1.000000000000
0.2000000000000 0.500000000000
0.2000000000000 0.210000000000
0.1420000000000 0.065000000000
0.0840000000000 0.004100000000
0.0428200000000 -0.014750000000
Decomposition of Variance for Series Y1
Step
1
2
3
4
5
6
Std Error
Y1
1.000000000 100.00000
1.135781669 96.89922
1.172220116 94.17801
1.182577270 92.83770
1.185563921 92.37173
1.186428643 92.25259
Y2
0.00000
3.10078
5.82199
7.16230
7.62827
7.74741
Decomposition of Variance for Series Y2
Step
1
2
3
4
5
6
Std Error
1.000000000
1.135781669
1.172220116
1.182577270
1.185563921
1.186428643
Y1
Y2
0.00000 100.00000
3.10078 96.89922
5.82199 94.17801
7.16230 92.83770
7.62827 92.37173
7.74741 92.25259
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
Écart-type de l’erreur de prévision de
Y1 après 2 périodes
(11+1111,12+2212,12)
(1+1,0(0,5)2+1,0(0,2)2
(1+0,25+0,04)
1,29
(1,29)½ = 1,1357
Pourcentage de la variance de l’erreur
de Y1 attribuable aux chocs v1 après 2
périodes
(11+1111,12)/1,29
1,25/1,29
96,89%
Pourcentage de la variance de l’erreur de Y1
attribuable aux chocs v2 après 2 périodes
2212,12/1,29
0,04/1,29
3,10%
Pourcentage de la variance de l’erreur de
Y1 attribuable aux chocs v1 après 3 périodes
(11+1111,12+1111,22)/(1,1722)2
(1+1,0(0,5)2+1,0(0,2)2/(1,1722)2
(1+0,25+0,04)/(1,1722)2
1,29/1,373
94,17%
8
Chocs triangulaires (lire avant le texte sur l’identification et le modèle IS-LM);
Dans le cas de chocs v1t et v2t corrélés entre eux, il faut absolument se prononcer sur une
structure causale, par exemple v1t  v2t
v1t = u1t
v2t = -21v1t + u2t
u1t et u2t sont des chocs de structure supposés orthogonaux de moyenne zéro et de
variance .
Dans ce cas,
E(v1t2) = E(u1t2) = 11
E(v1t v2t) = E[v1t (-21v1t + u2t)] = -2111 + 0
E(v2t2) = ( -21v1t + u2t)( -21v1t + u2t) = 21211 + 22
Si, la structure avait été renversée, v2t  v1t, alors
v1t = -12v2t + u1t
v2t = u2t
et
E(v2t2) = E(u2t2) = 22
E(v1t v2t) = E[(-12v1t + u2t)v2t] = -1222 + 0
E(v1t2) = ( -11v2t + u1t)( -12v2t + u1t) = 12222 + 11
Lors des calculs pratiques, il est beaucoup plus facile de procéder par décomposition
triangulaire
vt = Lut
où E(utut’) =  et L est une matrice triangulaire. Pour simplifier, nous supposons que
=I, i.e. chaque choc uit à une variance égale à l’unité et n’est pas corrélé avec les autres.
On peut aussi montrer que
E(vtvt’) = E(Lutut’L’) = LE(utut’)L’ = LIL’ = LL’= .
La représentation moyenne mobile
yt = vt + 1vt-1 + 2vt-2 + 3vt-3 + ... peut être réécrite selon
yt = Lut + 1Lut-1 + 2Lut-2 + 3Lut-3 + ...
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
9
= E[(LuT+h + 1LuT+h-1 + 2LuT+h-2 + …h-1LuT+1) (.)’]
Var(v*T+h)
= LL’ + 1LL’1’ + … + h-1LL’h-1’
Supposons la structure v1t  v2t, L est triangulaire inférieure et
 L11 0   L11 L21  11  21 
L



 21 L22   0 L22   21  22 
2
 L11

 L11 L21
L L21  11  21 


L  L222   21  22 
11
2
21
On peut alors déduire les Lij à partir des ij ou vice versa.
Pour la décomposition de variance et la représentation moyenne mobile, l’approche
triangulaire offre un cadre similaire mais qui s’interprète un peu différemment :
i.
ii.
iii.
La représentation moyenne mobile est calculée automatiquement avec des chocs
uit égaux à 1 ;
Selon la structure triangulaire, un choc uit peut avoir des effets immédiats sur les
autres variables, voir les Lij.
La décomposition de variance est obtenue directement de la représentation
moyenne mobile. Plus spécifiquement la somme des termes de moyenne mobile
au carré pour un horizon de prévision donné correspond automatiquement à la
variance de l’erreur de prévision de la variable en question.
*
VAR(1) stationnaire
*
La matrice OMEGAMA n'est pas diagonale
*
DECLARE SYMMETRIC OMEGA
LL’=
COMPUTE OMEGA = ||1.0|0.5,1.0||
*
ASSOCIATE(VARIANCE=1.0) 1
# 0.5 0.2
ASSOCIATE(VARIANCE=1.0) 2
# -0.2 0.5
COMPUTE CHO_DEC = %DECOMP(OMEGA)
WRITE CHO_DEC
1.0000
0.0000
0.5000
0.8660
COMPUTE Z = CHO_DEC*TR(CHO_DEC)
WRITE Z
1.0000
0.5000
0.5000
1.0000
*
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
10
ERRORS(IMPULSE,DECOMP=CHO_DEC) 2 6
# 1
# 2
L11
Responses to Shock in INNOV_1
Entry
1
2
3
4
5
6
Y1
1.0000000000000
0.6000000000000
0.3100000000000
0.1360000000000
0.0461000000000
0.0066600000000
Y2
0.500000000000
0.050000000000
-0.095000000000
-0.109500000000
-0.081950000000
-0.050195000000
Responses to Shock in INNOV_2
Entry
1
2
3
4
5
6
Y1
Y2
0.0000000000000 0.866025403784
0.1732050807569 0.433012701892
0.1732050807569 0.181865334795
0.1229756073374 0.056291651246
0.0727461339179 0.003550704156
0.0370832077900 -0.012773874706
Decomposition of Variance for Series Y1
Step
1
2
3
4
5
6
Std Error
INNOV_1
INNOV_2
1.000000000 100.00000
0.00000
1.178982612 97.84173
2.15827
1.231300126 96.04248
3.95752
1.244877102 95.15248
4.84752
1.247852640 94.83571
5.16429
1.248421295 94.75218
5.24782
Decomposition of Variance for Series Y2
Step
1
2
3
4
5
6
Std Error
INNOV_1
INNOV_2
1.000000000 25.00000 75.00000
1.090871211 21.21849 78.78151
1.110000000 21.22596 78.77404
1.116807504 21.92931 78.07069
1.119815793 22.34720 77.65280
1.121012988 22.49999 77.50001
6-837 – CHAP 7 : LE CAS MULTIVARIÉ
L21
L22
Pourcentage de la variance de l’erreur de
prévision d’horizon 2 attribuable au choc 1
(12+0,62)/ (12+0,62+0,17322)
1,36/1,389
0,979
Pourcentage de la variance de l’erreur de prévision
d’horizon 3 attribuable au choc 1
(12+0,62+0,312)/ (12+0,62+0,312+0,17322+0,17322)
1,36/1,389
0,9604
Pourcentage de la variance de l’erreur de
prévision d’horizon 1 attribuable au choc 2
0,8662/(.52+0,8662)
0,75
11
Téléchargement