Econométrie des variables qualitatives
Examen - 23 mai 2003 (2h sans documents)
Exercice 1
On estime un modèle PROBIT pour expliquer la variable dichotomique “avoir des enfants”
(ENF !1 ou 0) sachant le diplôme de l’individu (DIPL !1 si diplôme inférieur au bac, !2 si niveau
bac,!3 si diplôme supérieur au bac), son âge (AGE) et son âge au carré divisé par 100
(AGE2!
AGE
2
100
). Voici les résultats de l’estimation avec STATA, la commande vce affichant la matrice
de variance-covariance des paramètres estimés. L’échantillon ne contient que des personnes d’âge
compris entre 20 et 60 ans. Les variables _Idipl_1, _Idipl_2, _Idipl_3 résultent de la dichotomisation de
la variable DIPL.
. xi: probit enf i.dipl age age2
i.dipl _Idipl_1-3 (naturally coded; _Idipl_1 omitted)
Iteration 0: log likelihood = -18636.845
Iteration 1: log likelihood = -17371.858
Iteration 2: log likelihood = -17369.568
Iteration 3: log likelihood = -17369.568
Probit estimates Number of obs = 28922
LR chi2(4) = 2534.55
Prob > chi2 = 0.0000
Log likelihood = -17369.568 Pseudo R2 = 0.0680
------------------------------------------------------------------------------
enf | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_Idipl_2 | -.1324138 .0236364 -5.60 0.000 -.1787404 -.0860873
_Idipl_3 | -.2885005 .018667 -15.46 0.000 -.325087 -.2519139
age | .2996346 .006378 46.98 0.000 .2871339 .3121352
age2 | -.3834785 .0080627 -47.56 0.000 -.3992812 -.3676758
_cons | -4.966942 .1199125 -41.42 0.000 -5.201966 -4.731918
------------------------------------------------------------------------------
. vce
| _Idipl_2 _Idipl_3 age age2 _cons
-------------+---------------------------------------------
_Idipl_2 | .000559
_Idipl_3 | .000104 .000348
age | 5.3e-06 -4.8e-06 .000041
age2 | -3.7e-06 7.8e-06 -.000051 .000065
_cons | -.000248 -.000041 -.000755 .000932 .014379
1. Pourquoi l’estimation de ce modèle PROBIT fournit-il un modèle statistique de la fécondité ?
(Dites ce qu’estime un modèle PROBIT et faites le lien avec la notion démographique de
fécondité. Quelques lignes suffisent!)
2. Pourquoi a-t-on divisé le carré de l’âge par 100 pour effectuer la régression?
3. Diriez-vous que la fécondité diminue avec le diplôme ?
4. Comment testeriez-vous que le paramètre de la variable _Idipl_3 est significativement différent du
paramètredelavariable_Idipl_2 ?
5. Quel est l’effet de l’âge sur la fécondité ? A quel âge, toutes choses égales d’ailleurs, le modèle
estime-t-il maximale la probabilité d’avoir un enfant?
6. Calculer à l’aide de la matrice variance-covariance un estimateur de l’écart-type de cette
estimation. Vous pourrez utiliser le résultat numérique suivant:
1
400 41
0.3835
2
!102 0.2996
0.3835
3
"65 0.2996
2
0.3835
4
!1. 675 #10
!2
; 10.903 !0.129.
Exercice 2
On construit maintenant la variable NENF qui vaut 0, 1, 2, 3 ou 4 si le nombre d’enfants dans le
ménage est égal à 0, 1, 2, 3 ou plus de 4 enfants. On estime ensuite un modèle PROBIT ordonné à
seuils inconnus : NENF
i
!k"!0,1,2,3,4"si s
k
$x
i
%
b"u
i
#s
k"1
,
avec u
i
$N#0,!
2
$,s
0
!0ets
5
!"%.
Voici les résultats d’estimation obtenus à l’aide de STATA (les paramètres _cut1, ..., _cut4
dénotent les seuils s
1
, ..., s
4
du modèle):
. xi: oprobit nenf i.dipl age age2
i.dipl _Idipl_1-3 (naturally coded; _Idipl_1 omitted)
Iteration 0: log likelihood = -40356.058
Iteration 1: log likelihood = -39014.837
Iteration 2: log likelihood = -39013.178
Ordered probit estimates Number of obs = 28922
LR chi2(4) = 2685.76
Prob > chi2 = 0.0000
Log likelihood = -39013.178 Pseudo R2 = 0.0333
------------------------------------------------------------------------------
nenf | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_Idipl_2 | -.1145041 .0194437 -5.89 0.000 -.1526129 -.0763952
_Idipl_3 | -.2033115 .0155256 -13.10 0.000 -.2337412 -.1728817
age | .26945 .0054888 49.09 0.000 .2586921 .280208
age2 | -.3453101 .006959 -49.62 0.000 -.3589496 -.3316706
-------------+----------------------------------------------------------------
_cut1 | 4.436445 .1032947 (Ancillary parameters)
_cut2 | 5.178941 .1041345
_cut3 | 6.082835 .1050567
_cut4 | 6.83505 .1058442
------------------------------------------------------------------------------
. vce
| _Idipl_2 _Idipl_3 age age2 _cut1 _cut2 _cut3
-------------+---------------------------------------------------------------
_Idipl_2 | .000378
_Idipl_3 | .000066 .000241
age | 3.9e-06 -1.9e-06 .00003
age2 | -3.1e-06 3.3e-06 -.000038 .000048
_cut1 | .000168 .000047 .000559 -.000692 .01067
_cut2 | .000167 .000043 .000564 -.000698 .010729 .010844
_cut3 | .000165 .000041 .000569 -.000704 .010794 .010898 .011037
_cut4 | .000162 .000039 .000569 -.000705 .010803 .010903 .011025
| _cut4
-------------+---------
_cut4 | .011203
1. Vous observez que le programme n’estime ni la constante de la régression, ni la variance !
2
.
Pourquoi?
2. Les paramètres estimés par le modèle PROBIT ordonné sont proches de ceux estimés par le
modèle PROBIT simple. Pourquoi? En déduire que la constante du modèle PROBIT est égale à
l’opposé du seuil s
1
#!_cut1$.
3. Quelle est la probabilité estimée d’avoir 3 enfants pour un ménage de diplôme inférieur au bac et
de 35 ans (posez le calcul; ne le faites pas sans ordinateur!).
4. Calculer théoriquement le nombre d’enfants prédit par le modèle pour un ménage de
caractéristiques quelconques.
Exercice 3
Un couple de personnes en ménage est propriétaire de son logement s’il est assez riche. Soient X
1
et
X
2
leurs revenus respectifs. On suppose que les revenus des deux conjoints sont en réalité corrélés (par
un phénomène d’endogamie bien connu) et que
X
1
X
2
$Nm
1
m
2
,!
1
2
"!
1
!
2
"!
1
!
2
!
2
2
.
1. Calculer Pr!X
1
"X
2
&s|X
2
!x
2
".
Note: je rappelle que X
1
|X
2
!x
2
$N#m
1
"
"!
1
!
2
#x
2
!m
2
$,#1!"
2
$!
1
2
$.
2. Calculer Pr!X
1
"X
2
&s".
Exercice 4
Soit une variable aléatoire X$N#m,!
2
$.Soitaun réel positif.
1. Montrer sans calcul que E#X|X
2
&a$!0sim!0.
2. Montrer ensuite en toute généralité que
E#X|X
2
&a$!m"!#
a!m
!
!#
!a!m
!
!
!a!m
!
"1!!
a!m
!
pour un seuil a&0 quelconque.
Corrigé
1Exercice1
On estime un modèle PROBIT pour expliquer la probabilité d’avoir des enfants (ENF =1ou
0) sachant le diplôme du chef du ménage (DIPL =1si diplôme inférieur au bac, =2si niveau
bac,=3si diplôme supérieur au bac), l’âge (AGE), l’âge au carré (AGE2=AGE
2
/100).
Voici les résultats de l’estimation (la commande vce de STATA ache la matrice de variance-
covariance des paramètres estimés.
. xi: probit enf i.dipl age age2
i.dipl _Idipl_1-3 (naturally coded; _Idipl_1 omitted)
Iteration 0: log likelihood = -18636.845
Iteration 1: log likelihood = -17371.858
Iteration 2: log likelihood = -17369.568
Iteration 3: log likelihood = -17369.568
Probit estimates Number of obs = 28922
LR chi2(4) = 2534.55
Prob > chi2 = 0.0000
Log likelihood = -17369.568 Pseudo R2 = 0.0680
------------------------------------------------------------------------------
enf | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_Idipl_2 | -.1324138 .0236364 -5.60 0.000 -.1787404 -.0860873
_Idipl_3 | -.2885005 .018667 -15.46 0.000 -.325087 -.2519139
age | .2996346 .006378 46.98 0.000 .2871339 .3121352
age2 | -.3834785 .0080627 -47.56 0.000 -.3992812 -.3676758
_cons | -4.966942 .1199125 -41.42 0.000 -5.201966 -4.731918
------------------------------------------------------------------------------
. vce
| _Idipl_2 _Idipl_3 age age2 _cons
-------------+---------------------------------------------
_Idipl_2 | .000559
_Idipl_3 | .000104 .000348
age | 5.3e-06 -4.8e-06 .000041
age2 | -3.7e-06 7.8e-06 -.000051 .000065
_cons | -.000248 -.000041 -.000755 .000932 .014379
1. Pourquoi l’estimation de ce modèle PROBIT fournit-il un modèle statistique de la fé-
condité ? (Dites ce qu’estime un modèle PROBIT et faites le lien avec la notion démo-
graphique de fécondité.)
Un modèle dichotomique permet de décrire comment la probabilité d’un évènement change
avec les caractéristiques socio-démographiques des individus. L’étude de la fécondité est
justement l’étude socio-démographique de la propension à avoir des enfants.
1
2. Pourquoi a-t-on divisé le carré de l’âge par 100 pour eectuer la régression?
Pour augmenter l’ordre de grandeur du paramètre de la régression correpondant d’un
facteur 100.
3. Diriez-vous que la fécondité diminue avec le diplôme ?
Oui puisque le paramètre de la variable _Idipl_2=(dipl == 2) est négatif et que la
diérence du paramètre de _Idipl_3et de celui de _Idipl_2est aussi négatif. Avoir le
bac réduit donc les chances d’avoir des enfants et avoir un diplôme du supérieur les réduit
encore plus.
4. Comment testeriez-vous que le paramètre de la variable _Idipl_3est signiÞcativement
diérent du paramètre de la variable _Idipl_2?
Soit b
3
le paramètre associé à _Idipl_3et soit b
2
celui associé à _Idipl_2,etb
b
3
et b
b
2
leurs estimations. On estime b
3
b
2
comme b
b
3
b
b
2
=(0.2885 0.1324) = 0.1561 et
V³b
b
3
b
b
2
´=Vb
b
3
+Vb
b
2
2Cov³b
b
3
,b
b
2
´
=(348+5592×104) ×10
6
=699×10
6
=¡2.6434 ×10
2
¢
2
La statistique de Student du test de l’hypothèse b
3
b
2
=0est donc
0.1561
2.6434×10
2
=5.9053.
Elle est largement supérieure à 2. On rejette donc l’hypothèse nulle au seuil de 5%.
5. Quel est l’eet de l’âge sur la fécondité ? A quel âge, toutes choses égales d’ailleurs, le
modèle estime-t-il maximale la probabilité d’avoir un enfant?
Calculons la dérivée de la fonction: f(AGE)=0.2996AGE 0.3834
AGE
2
100
.f
0
(AGE)=
0.2996 2×0.3834
AGE
100
.Onaf
0
(AGE)>0pour tout AGE
0.2996×100
2×0.3834
=39.0.Les
chances d’avoir des enfants croissent donc jusqu’à l’âge de 39 ans et décroissent ensuite.
6. Calculer à l’aide de la matrice variance-covariance un estimateur de l’écart-type de cette
estimation. Vous pourrez utiliser le résultat numérique suivant:
1
400
µ41
0.3835
2
102 0.2996
0.3835
3
+650.2996
2
0.3835
4
=1.675 ×10
2
;10.903 = 0.129.
Notons ale coecient de l’âge et bcelui de
AGE
2
100
. L’estimateur de l’âge optimal est
bc=100׳
ba
2b
b
´.Savarianceasymptotiqueest
10
4
×Vµ
ba
2b
b
=10
4
×
³
ba
2b
b
´
³ba,b
b´Vµba
b
b
³
ba
2b
b
´
µba
b
b
=10
4
×
µ
1
2b
b,ba
2b
b
2
¶µ 41 ×10
6
51 ×10
6
51 ×10
6
65 ×10
6
Ã
1
2b
b
ba
2b
b
2
!
=10
2
4×
µ41
b
b
2
+2×51 ×ba
b
b
3
+65ba
2
b
b
4
=1
400
µ41
0.3835
2
102 0.2996
0.3835
3
+650.2996
2
0.3835
4
.
2
1 / 8 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !