Chapitre 7 : Le cas multivarié 1. Processus stochastiques multivariés y1t y 2t Soit y t ... y kt un vecteur de k variables d’intérêt . On peut citer plusieurs exemples intéressants : i. consommation revenu; ii. taux d’intérêt à court terme et à long terme; iii. monnaie, revenu et taux d’intérêt, etc. On sait que la matrice de variance covariance de yt (de dimension k x k) est donnée par Cov (yt yt-j ) = (j) j=0,1,2, ... Dans le cas k=2, ( j ) 12 ( j ) ( j ) 11 21 ( j ) 22 ( j ) j=0,1,2 2. Le modèles VAR : formulation et stationnarité. Formulation Le modèle AR(1) univarié postule une relation entre yt et yt-1. Son pendant multivarié VAR(1) procède de la même façon. Chaque variable sera reliée à chacune des autres variables retardées. Si k=2, y1,t = 1 + 11 y1,t-1 + 12 y2,t-1 + v1t y2,t = 2 + 21 y1,t-1 + 22 y2,t-1 + v2t où E(v1t2) = 11 , E(v2t2) = 22 et E(v1t v2t) = 12 . En notation matricielle, y1t 1 11 12 y1t 1 v1t y 2t 2 21 22 y 2t 1 v2t yt = + yt-1 + vt 6-837 – CHAP 7 : LE CAS MULTIVARIÉ 1 où E(vt vt’) = = 11 . 22 21 Dans le cas d’un VAR(2), on a y1,t = 1 + 11,1 y1,t-1 + 11,2 y1,t-2 + 12,1 y2,t-1 + 12,2 y2,t-2 + v1t y2,t = 2 + 21,1 y1,t-1 + 21,2 y1,t-2 + 22,1 y2,t-1 + 22,2 y2,t-2 + v2t En notation matricielle, y1t 11,1 12,1 y1t 1 11,2 12,2 y1t 2 v1t y y v y 21 , 1 22 , 1 21 , 2 22 , 2 2t 2t 1 2 t 2 2 t yt = + 1yt-1 + 2yt-2 + vt où E(vt vt’) = = 11 . 21 22 Dans la cas général, on écrit yt = + 1yt-1 + 2yt-2 + ... + pyt-p + vt où j sont des matrices de dimension k x k. Tout comme dans le cas univarié, on peut toujours écrire un modèle VAR(p) sous la forme d’un super modèle VAR(1) yt = + yt-1 + vt . Propriétés Supposons le modèle VAR(1) sans constante suivant (s’il n’y a pas de constante, la moyenne est zéro) : yt = yt-1 + vt 0 = E yt yt’ 0 0 = E[(yt-1 + vt)( yt-1 + vt)’] = E[yt-1yt-1’’ + ... + vt vt’] = E(yt-1yt-1’)’ + ... + E(vt vt’) = 0’+ 6-837 – CHAP 7 : LE CAS MULTIVARIÉ 2 1 = E yt yt-1’ = E[(yt-1 + vt)( yt-1)’] = E(yt-1yt-1’) = 0 j = j-1 = j0 Stationnarité On peut décomposer la matrice en = CC-1 où correspond à la matrice des racines caractéristiques. j = j0 = CjC-10. Le modèle VAR(1) avec k=2 sera stationnaire si les racines caractéristiques sont à l’intérieur du cercle unité (voir VAR1.PRG). Le même raisonnement s’applique au VAR(p) de dimension k mais on calcule rarement ces conditions dans la pratique ... on s’y prend d’une autre façon! En calculant la représentation moyenne mobile par exemple ... car elle doit absolument converger vers 0 dans le cas stationnaire. On conviendra qu’il s’agit d’une approche beaucoup plu simple. 3. Estimation et choix de p Estimation On peut estimer chacune des k équations du modèle VAR(p) à l’aide des MC. On peut montrer que les mêmes propriétés que si on avait utilisé des méthodes plus sophistiquées qui tiennent compte de la covariance entre les termes d’erreurs (SUR). Choix de p Le choix du retard maximal p se fait un peu comme dans le cas univarié avec, bien sûr, quelques ajustements. L’approche la plus utilisée est sans aucun doute le test de rapport de vraisemblance qui demande très peu d’adaptations. Ainsi, supposons le test suivant : H0 : VAR(2) H1 : VAR(4). Il faut tout d’abord estimer chacune des équations sous H1, i.e. un VAR(4) à l’aide des MC, sauvegarder les résidus et calculer la matrice de variance covariance NC qui correspond en quelque sorte à la variance NC dans le cas du AR univarié. Il faut ensuite estimer chacune des équations sous H0, i.e. un VAR(2) à l’aide des MC, sauvegarder les 6-837 – CHAP 7 : LE CAS MULTIVARIÉ 3 résidus et calculer la matrice de variance covariance C . Le test de rapport de vraisemblance dans le cas multivarié est donné par RV = T [log | NC | - log | C | ] qui suit une X2(q) où | .| correspond à l’opérateur déterminant et q représente le nombre de restrictions. Dans le cas qui nous intéresse avec k=4, q= 4*4*2=32, i.e. j’impose 8 coefficients égaux à 0 pour chacune des 4 équations d’où 32 restrictions. Le rôle de l’opérateur déterminant est de transformer les matrices NC et C en scalaires selon une approche assez intuitive. Ainsi, 12 12 2 2 2 | C | = 2 = 1 2 12 21 2 car 12 21 . On constate que le déterminant sera d’autant plus petit (donc le modèle performant) si les deux variances estimées, qui entrent de façon multiplicative dans le calcul du déterminant, sont petites. Il faut bien sûr tenir compte de la covariance qui viendra réduire encore plus le résultat si elle est positive. Il existe aussi une version multivariée du critère d’Akaike qui est donnée par AIC = T log | | + 2 (k2*p) où k2*p est le nombre de paramètres estimés dans un VAR(p) de dimension k. 4. Représentation moyenne mobile Soit le modèle VAR(1) yt = yt-1 + vt où yt et vt sont des vecteurs (2x1) et est une matrice de paramètres (2x2). On cherche la représentation moyenne mobile yt = vt + 1vt-1 + 2vt-2 + 3vt-3 + ... où les matrices j (j=1,2,...) sont de dimension (2x2). Plus spécifiquement 11,1 12,1 1 21,1 22,1 6-837 – CHAP 7 : LE CAS MULTIVARIÉ 4 Ainsi, 12,1 correspond l’impact d’un choc v2t sur la variable y1 après 1 période. De façon plus générale, ik,j correspond l’impact d’un choc vkt sur la variable yi après j périodes. Pour trouver la représentation moyenne mobile d’un modèle VAR, pas question de procéder à des dérivations analytiques compliquées : l’approche numérique s’avère beaucoup plus simple ... surtout avec la commande IMPULSE de RATS. Ainsi y1,t = 0,5 y1,t-1 + 0,2 y2,t-1 + v1t y2,t = -0,2 y1,t-1 + 0,5 y2,t-1 + v2t Supposons le scénario v1t=1 pour t=1 et v1t=0 pour tous les autres t et v2t=0 pour tous les t. Pour t=1 1 = 0,5 (0) + 0,2 (0) + 1 0 = -0,2 (0) + 0,5 (0) + 0 Pour t=2 0,5 = 0,5 (1) + 0,2 (0) + 0 -0,2 = -0,2 (1) + 0,5 (0) + 0 11,1 21,1 Pour t=3 11,2 21,2 0,21 = 0,5 (0,5) + 0,2 (-0,2) + 0 -0,2 = -0,2 (0,5) + 0,5 (-0,2) + 0 Supposons le scénario v2t=1 pour t=1 et v2t=0 pour tous les autres t et v1t=0 pour tous les t. Pour t=1 0 = 0,5 (0) + 0,2 (0) + 0 1 = -0,2 (0) + 0,5 (0) + 1 Pour t=2 0,2 = 0,5 (0) + 0,2 (1) + 0 0,5 = -0,2 (0) + 0,5 (1) + 0 12,1 22,1 Pour t=3 0,20 = 0,5 (0,2) + 0,2 (0,5) + 0 0,21 = -0,2 (0,2) + 0,5 (0,5) + 0 6-837 – CHAP 7 : LE CAS MULTIVARIÉ 12,2 22,2 5 5. Prévisions et variance de l’erreur de prévision y*1,T+h = 11 y*1,T+h-1 + 12 y*2,T+h-1 y*2,T+h = 21 y*1,T+h-1 + 22 y*2,T+h-1 Pour h=1 y*1,T+1 = 11 y1,T + 12 y2,T y1,T+1- y*1,T+1 = v1,T+1 = v*1,T+1 et Var(v*1,T+1) = 11 Pour h=2 y*1,T+2 = 11 y*1,T+1 + 12 y*2,T+1 e*1,T+2 = y1,T+2- y*1,T+2 = 11 y1,T+1 + 12 y2,T+1 + v1,T+2 - 11 y*1,T+1 - 12 y*2,T+1 = v1,T+2 + 11 (y1,T+1- y*1,T+1) + 12 (y2,T+1- y*2,T+1) = v1,T+2 + 11v1,T+1 + 12v2,T+1 Var(e*1,T+2) = E(v1,T+2 + 11v1,T+1 + 12v2,T+1)( v1,T+2 + 11v1,T+1 + 12v2,T+1) = E( [v1,T+2]2 + [11v1,T+1]2 + [12v2,T+1]2 + 21112v1,T+1v2,T+1 + …..) = 11+ 11211 + 12222 + 2111212 Dans le cas général matriciel v*T+h = vT+h + 1vT+h-1 + 2vT+h-2 + …h-1vT+1 Var(v*T+h) = E[(vT+h + 1vT+h-1 + 2vT+h-2 + …h-1vT+1) (.)’] = + 11’ + … + h-1h-1’ Pour h=1 Var(v*T+1) = Pour h=2 Var(v*T+2) = + 11’ etc. 6-837 – CHAP 7 : LE CAS MULTIVARIÉ 6 6. Impulse et décomposition de variance Revenons au modèle AR(1) simple où yt = + yt-1 + et et yt = et + 1et-1 + 2et-2 + 3et-3 + ... La variance de yt vient essentiellement du fait que cette série est en fait une combinaison linéaire de chocs (tous de variance égale à 2) qui ont un effet décroissant. Plus spécifiquement, dans le cas du AR(1) où j = j Var(yt) = 2(1 + (2)1 + (2)2 + (2)3 …) = 2/(1-2). Intéressons-nous maintenant à la question suivante : quelle proportion de la variance de yt est-elle attribuable au trois premiers chocs? La réponse peut être trouvée facilement à l’aide des formules données ci-dessus. Plus spécifiquement, il s’agit de regarder la contribution des chocs et , et-1 et et-2 à la variance totale i.e. 2 (1 2 ( 2 ) 2 ) = x% 2 2 1 Dans un modèle multivarié, la question naturelle à poser est beaucoup plus intéressante. Mais avant notons que la représentation moyenne mobile de la première variable y1t d’un modèle VAR de deux variables : y1t = v1t + 11,1v1,t-1 + 12,1v2,t-1 + 11,2v1,t-2 + 12,2v2,t-1 … La variance de yt vient essentiellement du fait que cette série est en fait une combinaison linéaire de chocs v1t et v2t qui ont un effet décroissant. Sous l’hypothèse que E(v1t v2t) =0 i.e. la matrice de variance-covariance est diagonale Var(y1t ) = 11 + (11,1)211 + (12,1)222 + (11,2)211 + (12,2)222 … Cette dernière formulation est l’ingrédient essentiel pour construire la variance d’une erreur de prévision pour un horizon h. Ainsi, pour un horizon h=2 Var(e*1,T+2) = 11+ 11,1211 + 12,1222 dont 11+ 11,1211 est attribuable à des chocs v1t i.e. des chocs propres à la variable y1. Le pourcentage de la variance de l’erreur de prévision de y1 attribuable à des chocs v1t est donné par (11+ 11,1211)/ (11+ 11,1211 + 12,1222) et pourcentage de la variance 6-837 – CHAP 7 : LE CAS MULTIVARIÉ 7 de l’erreur de prévision de y1 attribuable à des chocs v2t est donné par (12,1222)/ (11+ 11,1211 + 12,1222). La commande ERRORS du programme RATS calcule automatiquement ces statistiques importantes. ERRORS(IMPULSE) 2 6 # 1 # 2 Responses to Shock in Y1 Entry 1 2 3 4 5 6 Y1 1.000000000000 0.500000000000 0.210000000000 0.065000000000 0.004100000000 -0.014750000000 Y2 0.000000000000 -0.200000000000 -0.200000000000 -0.142000000000 -0.084000000000 -0.042820000000 Responses to Shock in Y2 Entry 1 2 3 4 5 6 Y1 Y2 0.0000000000000 1.000000000000 0.2000000000000 0.500000000000 0.2000000000000 0.210000000000 0.1420000000000 0.065000000000 0.0840000000000 0.004100000000 0.0428200000000 -0.014750000000 Decomposition of Variance for Series Y1 Step 1 2 3 4 5 6 Std Error Y1 1.000000000 100.00000 1.135781669 96.89922 1.172220116 94.17801 1.182577270 92.83770 1.185563921 92.37173 1.186428643 92.25259 Y2 0.00000 3.10078 5.82199 7.16230 7.62827 7.74741 Decomposition of Variance for Series Y2 Step 1 2 3 4 5 6 Std Error 1.000000000 1.135781669 1.172220116 1.182577270 1.185563921 1.186428643 Y1 Y2 0.00000 100.00000 3.10078 96.89922 5.82199 94.17801 7.16230 92.83770 7.62827 92.37173 7.74741 92.25259 6-837 – CHAP 7 : LE CAS MULTIVARIÉ Écart-type de l’erreur de prévision de Y1 après 2 périodes (11+1111,12+2212,12) (1+1,0(0,5)2+1,0(0,2)2 (1+0,25+0,04) 1,29 (1,29)½ = 1,1357 Pourcentage de la variance de l’erreur de Y1 attribuable aux chocs v1 après 2 périodes (11+1111,12)/1,29 1,25/1,29 96,89% Pourcentage de la variance de l’erreur de Y1 attribuable aux chocs v2 après 2 périodes 2212,12/1,29 0,04/1,29 3,10% Pourcentage de la variance de l’erreur de Y1 attribuable aux chocs v1 après 3 périodes (11+1111,12+1111,22)/(1,1722)2 (1+1,0(0,5)2+1,0(0,2)2/(1,1722)2 (1+0,25+0,04)/(1,1722)2 1,29/1,373 94,17% 8 Chocs triangulaires (lire avant le texte sur l’identification et le modèle IS-LM); Dans le cas de chocs v1t et v2t corrélés entre eux, il faut absolument se prononcer sur une structure causale, par exemple v1t v2t v1t = u1t v2t = -21v1t + u2t u1t et u2t sont des chocs de structure supposés orthogonaux de moyenne zéro et de variance . Dans ce cas, E(v1t2) = E(u1t2) = 11 E(v1t v2t) = E[v1t (-21v1t + u2t)] = -2111 + 0 E(v2t2) = ( -21v1t + u2t)( -21v1t + u2t) = 21211 + 22 Si, la structure avait été renversée, v2t v1t, alors v1t = -12v2t + u1t v2t = u2t et E(v2t2) = E(u2t2) = 22 E(v1t v2t) = E[(-12v1t + u2t)v2t] = -1222 + 0 E(v1t2) = ( -11v2t + u1t)( -12v2t + u1t) = 12222 + 11 Lors des calculs pratiques, il est beaucoup plus facile de procéder par décomposition triangulaire vt = Lut où E(utut’) = et L est une matrice triangulaire. Pour simplifier, nous supposons que =I, i.e. chaque choc uit à une variance égale à l’unité et n’est pas corrélé avec les autres. On peut aussi montrer que E(vtvt’) = E(Lutut’L’) = LE(utut’)L’ = LIL’ = LL’= . La représentation moyenne mobile yt = vt + 1vt-1 + 2vt-2 + 3vt-3 + ... peut être réécrite selon yt = Lut + 1Lut-1 + 2Lut-2 + 3Lut-3 + ... 6-837 – CHAP 7 : LE CAS MULTIVARIÉ 9 = E[(LuT+h + 1LuT+h-1 + 2LuT+h-2 + …h-1LuT+1) (.)’] Var(v*T+h) = LL’ + 1LL’1’ + … + h-1LL’h-1’ Supposons la structure v1t v2t, L est triangulaire inférieure et L11 0 L11 L21 11 21 L 21 L22 0 L22 21 22 2 L11 L11 L21 L L21 11 21 L L222 21 22 11 2 21 On peut alors déduire les Lij à partir des ij ou vice versa. Pour la décomposition de variance et la représentation moyenne mobile, l’approche triangulaire offre un cadre similaire mais qui s’interprète un peu différemment : i. ii. iii. La représentation moyenne mobile est calculée automatiquement avec des chocs uit égaux à 1 ; Selon la structure triangulaire, un choc uit peut avoir des effets immédiats sur les autres variables, voir les Lij. La décomposition de variance est obtenue directement de la représentation moyenne mobile. Plus spécifiquement la somme des termes de moyenne mobile au carré pour un horizon de prévision donné correspond automatiquement à la variance de l’erreur de prévision de la variable en question. * VAR(1) stationnaire * La matrice OMEGAMA n'est pas diagonale * DECLARE SYMMETRIC OMEGA LL’= COMPUTE OMEGA = ||1.0|0.5,1.0|| * ASSOCIATE(VARIANCE=1.0) 1 # 0.5 0.2 ASSOCIATE(VARIANCE=1.0) 2 # -0.2 0.5 COMPUTE CHO_DEC = %DECOMP(OMEGA) WRITE CHO_DEC 1.0000 0.0000 0.5000 0.8660 COMPUTE Z = CHO_DEC*TR(CHO_DEC) WRITE Z 1.0000 0.5000 0.5000 1.0000 * 6-837 – CHAP 7 : LE CAS MULTIVARIÉ 10 ERRORS(IMPULSE,DECOMP=CHO_DEC) 2 6 # 1 # 2 L11 Responses to Shock in INNOV_1 Entry 1 2 3 4 5 6 Y1 1.0000000000000 0.6000000000000 0.3100000000000 0.1360000000000 0.0461000000000 0.0066600000000 Y2 0.500000000000 0.050000000000 -0.095000000000 -0.109500000000 -0.081950000000 -0.050195000000 Responses to Shock in INNOV_2 Entry 1 2 3 4 5 6 Y1 Y2 0.0000000000000 0.866025403784 0.1732050807569 0.433012701892 0.1732050807569 0.181865334795 0.1229756073374 0.056291651246 0.0727461339179 0.003550704156 0.0370832077900 -0.012773874706 Decomposition of Variance for Series Y1 Step 1 2 3 4 5 6 Std Error INNOV_1 INNOV_2 1.000000000 100.00000 0.00000 1.178982612 97.84173 2.15827 1.231300126 96.04248 3.95752 1.244877102 95.15248 4.84752 1.247852640 94.83571 5.16429 1.248421295 94.75218 5.24782 Decomposition of Variance for Series Y2 Step 1 2 3 4 5 6 Std Error INNOV_1 INNOV_2 1.000000000 25.00000 75.00000 1.090871211 21.21849 78.78151 1.110000000 21.22596 78.77404 1.116807504 21.92931 78.07069 1.119815793 22.34720 77.65280 1.121012988 22.49999 77.50001 6-837 – CHAP 7 : LE CAS MULTIVARIÉ L21 L22 Pourcentage de la variance de l’erreur de prévision d’horizon 2 attribuable au choc 1 (12+0,62)/ (12+0,62+0,17322) 1,36/1,389 0,979 Pourcentage de la variance de l’erreur de prévision d’horizon 3 attribuable au choc 1 (12+0,62+0,312)/ (12+0,62+0,312+0,17322+0,17322) 1,36/1,389 0,9604 Pourcentage de la variance de l’erreur de prévision d’horizon 1 attribuable au choc 2 0,8662/(.52+0,8662) 0,75 11