Chapitre 3 Estimateur par le ratio et par la régression

Téléchargement

ESTIMATION D’UN RAPPORT DE MOYENNES ET UTILISATION DE L’INFORMATION

AUXILIAIRE

Dans plusieurs enquêtes les quantités à estimer s’expriment comme des rapports de totaux, par

exemple

Nb total de personnes qui occupent un emploi

taux de chômage = 1 - Nb total de personnes disponibles à l'emploi

On va maintenant étudier les propriétés échantillonnales de ce type de statistique. On va d’abord

travailler sur le rapport de deux moyennes échantillonnales,

s s s

r y x

, calculé à l’aide d’un

échantillon aléatoire simple. La statistique rs n’est pas une fonction linéaire des variables

indicatrices Z1,…,ZN ; il n’est donc pas possible de calculer une expression simple pour son

espérance et sa variance. Il faut procéder par approximation.

La caractéristique de la population estimée par rs est

U U U

r y x

; rs n’est pas une estimation

non biaisé de rU . Cependant sous certaines conditions

rr

tend vers 0 en probabilité dans un

contexte semblable à celui du théorème de la limite centrale de Hajek, dans la mesure où

est

non nul. On dit que rs est une estimation convergente de rU ou bien qu’elle est asymptotiquement

non biasée.

Pour évaluer sa variance on va approximer rs par une fonction linéaire de Z1,…,ZN . On procède

comme suit,

petit petit

s U s U s s U s

ss U U s U U

U s U s

y y y r x y y x

rx x x x x x

y y r x

   



      

   

   





Ainsi

 

Var( ) Var Var

U s U s

U U U

y y r x

x x x





  





avec

i i U i

z y r x

En fait

( , ) ( , )

s U s s U U

r r g x y g x y  

où g(x,y)=y/x et on a approximé la différence à l’aide d’une

expansion en série de Taylor d’ordre 1 de la fonction bivariée g(x,y).

Ce résultat approximatif est valable quel que soit le plan de sondage. S’il est aléatoire simple

sans remise un estimateur de variance « approximativement » non biaisé est

 

22 2 2

()

1 1 1 1

( ) 2

i s i

s y s xy s x

y r x

v r s r s r s

x n n x n







     





où sxy est la covariance échantillonnale entre les deux variables.

Dans un plan stratifié,

 

1 { ( )}

Var( ) Var 1

Hh h hi hU U hi hU

s str hi

U U h h

N f y y r x x

x x N n N



   

 



et l’estimateur de variance s’obtient en estimant la variance de z dans la strate h par la variance

échantillonnale et en prenant

rr

Exemple : Étude des propriétés de l’estimateur

dans une petite population pour un plan

d’échantillonnage aléatoire simple sans remise.

Tableau 1 : Valeurs de y et de x pour les 6 unités d’une population artificielle

Dans la population à l’étude,

8.17, 4.0

yx

2.042/

U U U

r y x 

et Sx2=2, Sy2=42.97 et la

covariance est Sxy=8.2 et la corrélation est R= Sxy/ Sx Sy=0.88. Un échantillon aléatoire simple de

taille n=3 est tiré de cette population. Ainsi le rapport des deux moyennes

s s s

r y x

est une

variable aléatoire discrète prenant 20 valeurs, chacune avec une probabilité de 1/20. Le tableau

2 donne les 20 valeurs possibles de l’estimateur

et étudie ses propriétés échantillonnales.

On observe les résultats suivants :



( / ) 2.0 2.042

E y x 

ainsi

sous-estime

d’environ 2%

 L’approximation de

 

Var /

obtenue par linéarisation est

 

22 2 2

{ ( )}

1 1 1 1

Var( ) 2

42.97 2 2.042 8.2 2.042 2 0.186

Ni U U i U

s y U xy U x

y y r x x

r S r S r S

x n N x n



  



   



       



L’erreur quadratique moyenne de

( / ) 2.042

s U s

ss SU

s U s

y y y

EQM y x E x x x





   



   



   

   







=0.205,

la variance approximative sous-estime l’erreur quadratique moyenne par environ 10%;

 L’espérance de l’estimateur de variance par linéarisation,

( / )

v y x

, est

 

( ) ( )

E v r v r





= 0.156.

L’estimateur de variance

( / )

v y x

sous-estime

( / )

EQM y x

par 24%.

 Le taux de couverture réel de l’intervalle de confiance avec un taux nominal de 95% calculé

avec

0.975,2 4.3t

est de 80%.

Tableau 2 : Distribution de

( / )

v y x

pour la population du Tableau 1.

Echant.

y1=3

x1=2

y2=4

x2=3

y3=18

x3=6

y4=4

x4=4

y5=5

x5=4

y6=15

x6=5

( / )

v y x

IC-

IC+

Co.

2.27

0.182

0.44

4.11

1.22

0.011

0.77

1.68

1.33

0.002

1.14

1.53

2.2

0.185

0.35

4.05

2.08

0.262

-0.12

4.29

2.17

0.209

0.20

4.13

2.77

0.043

1.88

3.66

1.2

0.008

0.82

1.58

0.260

-0.19

4.19

2.09

0.207

0.14

4.05

0.249

-0.14

4.14

2.08

0.207

0.12

4.03

2.64

0.089

1.36

3.92

1.18

0.005

0.88

1.49

1.92

0.239

-0.18

4.02

0.198

0.09

3.91

1.93

0.239

-0.17

4.03

2.47

0.173

0.68

4.25

2.53

0.132

0.97

4.10

1.85

0.224

-0.19

3.88

Valeur moyenne

2.00

0.16

0.8

1 / 19 100%

Documents connexes

les notations

Econométrie 1 : TD 2

ExamHLMA406bis Fichier

Détermination d`une statistique exhaustive Estimateurs et

Devoir3

TD no 10 : Bases de l`estimation paramétrique

Devoir2

StatL3S6 code ECUE E64XP1

TP 4 - David Haziza Website

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Chapitre 3 Estimateur par le ratio et par la régression

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Chapitre 3 Estimateur par le ratio et par la régression

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib