1
ESTIMATION D’UN RAPPORT DE MOYENNES ET UTILISATION DE L’INFORMATION
AUXILIAIRE
Dans plusieurs enquêtes les quantités à estimer s’expriment comme des rapports de totaux, par
exemple
Nb total de personnes qui occupent un emploi
taux de chômage = 1 - Nb total de personnes disponibles à l'emploi
On va maintenant étudier les propriétés échantillonnales de ce type de statistique. On va d’abord
travailler sur le rapport de deux moyennes échantillonnales,
/
s s s
r y x
, calculé à l’aide d’un
échantillon aléatoire simple. La statistique rs n’est pas une fonction linéaire des variables
indicatrices Z1,…,ZN ; il n’est donc pas possible de calculer une expression simple pour son
espérance et sa variance. Il faut procéder par approximation.
La caractéristique de la population estimée par rs est
/
U U U
r y x
; rs n’est pas une estimation
non biaisé de rU . Cependant sous certaines conditions
||
Us
rr
tend vers 0 en probabilité dans un
contexte semblable à celui du théorème de la limite centrale de Hajek, dans la mesure où
U
x
est
non nul. On dit que rs est une estimation convergente de rU ou bien quelle est asymptotiquement
non biasée.
Pour évaluer sa variance on va approximer rs par une fonction linéaire de Z1,…,ZN . On procède
comme suit,
2
petit petit
1
s U s U s s U s
ss U U s U U
U s U s
UU
y y y r x y y x
rx x x x x x
y y r x
xx
 
 
 
 

Ainsi
 
2
1
Var( ) Var Var
U s U s
ss
U U U
y y r x
rz
x x x

 


avec
.
En fait
( , ) ( , )
s U s s U U
r r g x y g x y 
g(x,y)=y/x et on a approximé la différence à laide dune
expansion en série de Taylor dordre 1 de la fonction bivariée g(x,y).
Ce résultat approximatif est valable quel que soit le plan de sondage. Sil est aléatoire simple
sans remise un estimateur de variance « approximativement » non biaisé est
 
22 2 2
22
()
1 1 1 1
( ) 2
1
i s i
s y s xy s x
iS
ss
y r x
ff
v r s r s r s
x n n x n

 
sxy est la covariance échantillonnale entre les deux variables.
Dans un plan stratifié,
3
 
22
22
11
1 { ( )}
11
Var( ) Var 1
h
N
Hh h hi hU U hi hU
s str hi
U U h h
N f y y r x x
rz
x x N n N

 


et l’estimateur de variance s’obtient en estimant la variance de z dans la strate h par la variance
échantillonnale et en prenant
ˆ
Us
rr
.
Exemple : Étude des propriétés de l’estimateur
/
ss
yx
dans une petite population pour un plan
d’échantillonnage aléatoire simple sans remise.
Tableau 1 : Valeurs de y et de x pour les 6 unités d’une population artificielle
i
1
2
3
4
5
6
y
3
4
18
4
5
15
x
2
3
6
4
4
5
Dans la population à l’étude,
8.17, 4.0
UU
yx
et
2.042/
U U U
r y x
et Sx2=2, Sy2=42.97 et la
covariance est Sxy=8.2 et la corrélation est R= Sxy/ Sx Sy=0.88. Un échantillon aléatoire simple de
taille n=3 est tiré de cette population. Ainsi le rapport des deux moyennes
/
s s s
r y x
est une
variable aléatoire discrète prenant 20 valeurs, chacune avec une probabilité de 1/20. Le tableau
2 donne les 20 valeurs possibles de l’estimateur
/
ss
yx
et étudie ses propriétés échantillonnales.
On observe les résultats suivants :
4
( / ) 2.0 2.042
ss
E y x 
ainsi
/
ss
yx
sous-estime
/
UU
yx
d’environ 2%
L’approximation de
 
Var /
ss
yx
obtenue par linéarisation est
 
 
22 2 2
22
1
2
2
{ ( )}
1 1 1 1
Var( ) 2
1
11
42.97 2 2.042 8.2 2.042 2 0.186
46
Ni U U i U
s y U xy U x
i
UU
y y r x x
ff
r S r S r S
x n N x n
 

 
 
L’erreur quadratique moyenne de
/
ss
yx
,
22
1
( / ) 2.042
20
s U s
ss SU
s U s
y y y
EQM y x E x x x

 

 

 
 


=0.205,
la variance approximative sous-estime lerreur quadratique moyenne par environ 10%;
L’espérance de lestimateur de variance par linéarisation,
( / )
ss
v y x
, est
 
1
( ) ( )
20
ss
SU
E v r v r
= 0.156.
L’estimateur de variance
( / )
ss
v y x
sous-estime
( / )
ss
EQM y x
par 24%.
Le taux de couverture réel de l’intervalle de confiance avec un taux nominal de 95% calculé
avec
0.975,2 4.3t
est de 80%.
5
Tableau 2 : Distribution de
/
ss
yx
et
( / )
ss
v y x
pour la population du Tableau 1.
Echant.
y1=3
x1=2
y2=4
x2=3
y3=18
x3=6
y4=4
x4=4
y5=5
x5=4
y6=15
x6=5
/
ss
yx
( / )
ss
v y x
IC-
IC+
Co.
1
1
1
1
0
0
0
2.27
0.182
0.44
4.11
1
2
1
1
0
1
0
0
1.22
0.011
0.77
1.68
0
3
1
1
0
0
1
0
1.33
0.002
1.14
1.53
0
4
1
1
0
0
0
1
2.2
0.185
0.35
4.05
1
5
1
0
1
1
0
0
2.08
0.262
-0.12
4.29
1
6
1
0
1
0
1
0
2.17
0.209
0.20
4.13
1
7
1
0
1
0
0
1
2.77
0.043
1.88
3.66
1
8
1
0
0
1
1
0
1.2
0.008
0.82
1.58
0
9
1
0
0
1
0
1
2
0.260
-0.19
4.19
1
10
1
0
0
0
1
1
2.09
0.207
0.14
4.05
1
11
0
1
1
1
0
0
2
0.249
-0.14
4.14
1
12
0
1
1
0
1
0
2.08
0.207
0.12
4.03
1
13
0
1
1
0
0
1
2.64
0.089
1.36
3.92
1
14
0
1
0
1
1
0
1.18
0.005
0.88
1.49
0
15
0
1
0
1
0
1
1.92
0.239
-0.18
4.02
1
16
0
1
0
0
1
1
2
0.198
0.09
3.91
1
17
0
0
1
1
1
0
1.93
0.239
-0.17
4.03
1
18
0
0
1
1
0
1
2.47
0.173
0.68
4.25
1
19
0
0
1
0
1
1
2.53
0.132
0.97
4.10
1
20
0
0
0
1
1
1
1.85
0.224
-0.19
3.88
1
Valeur moyenne
2.00
0.16
0.8
1 / 19 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !