Tirage de grappes avec probabilités proportionnelles aux tailles

Tirages de grappes avec probabilités proportionnelles aux tailles
Méthode des effectifs cumulés [n = 1]
Une façon de tirer une unité primaire i avec probabilités proportionnelles aux tailles Mi est la suivante. On divise
l'intervalle [0,1) en N intervalles dont les bornes sont
0 , K
M1, K
MM 21 + , K
MMM 321 ++ , … , K
MMM N121 ...
+++ , 1
K = et N est le nombre de grappes.
=
N
ii
M
1
Ensuite on génère un nombre entre 0 et 1 et on tire la grappe i si le nombre généré se situe dans le ie intervalle.
Exemple:
Le tableau suivant illustre comment tirer une observation d'une population de 20 ménages avec probabilités
proportionnelles aux nombres de personnes dans les ménages
Tirage de grappes avec probabilités proportionnelles aux tailles
Tirage d’un ménage dans une population de 20 ménages
Ménage Taille
(Mi)
Cumul
(Mi )
Cumul relatif
(Cumul/K) Intervalle
1 3 3 0,0411 0,0000- 0,0411
2 5 8 0,1096 0,0411- 0,1096
3 2 10 0,1370 0,1096- 0,1370
4 4 14 0,1918 0,1370- 0,1918
5 3 17 0,2329 0,1918- 0,2329
6 2 19 0,2603 0,2329- 0,2603
7 4 23 0,3151 0,2603- 0,3151
8 4 27 0,3699 0,3151- 0,3699
9 2 29 0,3973 0,3699- 0,3973
10 1 30 0,4110 0,3973- 0,4110
11 3 33 0,4521 0,4110- 0,4521
12 5 38 0,5205 0,4521- 0,5205
13 2 40 0,5479 0,5205- 0,5479
14 6 46 0,6301 0,5479- 0,6301
15 4 50 0,6849 0,6301- 0,6849
16 3 53 0,7260 0,6849- 0,7260
17 7 60 0,8219 0,7260- 0,8219
18 2 62 0,8493 0,8219- 0,8493
19 3 65 0,8904 0,8493- 0,8904
20 8 73 1,0000 0,8904- 1,0000
K =73
Lorsqu'on tire un échantillon de taille n avec remise et probabilités proportionnelles aux Mi, chaque unité est tirée de
cette même fon.
Méthode de Lahiri [n = 1]
Soit M max{M1,…,MN}.
a. On tire une unité au hasard, avec probabilités 1/N. Soit i l’unité tirée et Mi sa taille.
b. On génère un nombre aléatoire u de loi uniforme sur [0 ; M).
c. Si u Mi, l’unité i est conservée.
d. Si u > Mi, on rejette l’unité tiré et on recommence à l’étape a.
Méthode de Sunter [Applied Statistics, 26, (1977), 261-268; et Int. Statist. Rev.,54, (1986), 33-50]
Méthode 1
L’objectif est de tirer un échantillon de taille n sans remise avec probabilités d’inclusion πi (i = 1, … , N) proportion-
nelles à des tailles ψi (i = 1,…, N) telles que 1
N
i
i=
ψ
= 1. Les πi satisfont alors πi = nψi. Nous supposons donc que 0
< nψi 1 pour tout i. Soit Qi = .
N
j
ji=ψ
a. Au pas 1, la première unité est retenue avec probabilité π1.
b. Au pas 2, la 2e unité est sélectionnée avec probabilité nψ2/(1-ψ1) si l’unité 1 n’a pas été sélectionnée; et
avec probabilité (n-1)ψ2/(1-ψ1) si l’unité 1 a été sélectionnée.
c. Supposons les i-1 premiers pas réalisés. Au pas i, on sélectionne l’unité i avec probabilité ii
i
nn
Q
ψ
, où ni
est le nombre d’unités sélectionnées jusqu’au pas i-1.
d. La procédure se termine lorsque ni = n.
En d’autres termes chaque étape est une répétition du pas 1 : après la ie étape, il reste n-ni à sélectionner d’une popu-
lation dont les unités i, … , N ont des poids ,...,
iN
ii
QQ
ψ
ψ.
Il est possible, cependant, que la procédure doive s’arrêter avant que ni soit égal à n, car il peut arriver que
ii
i
nn
Q
ψ> 1. Si i* la première valeur de i pour laquelle **
*
ii
i
nn
Q
ψ
>1, alors on tire un échantillon aléatoire simple
de n-ni* de la population constituée des unités i*, … , N. On a alors les résultats suivants :
πi = nψi pour 1 i < i* et πi = *
*1i
n
N
iQ
−+ pour i* i N
πij > 0, i < j N
πiπj-πij > 0 , i < j N
L’évaluation des πij demeure compliquée, sauf pour i < j < i*. Dans ce cas on a
πij = 1
12
123
(1) 11...1
ij i
ii
nn
QQQ
+
−ψψ ψ
ψψ
−− −






Q
.
Méthode 2
Une deuxième méthode de Sunter permet d’éviter certaines des difficultés de la première. On commence par
extraire de la population (pour les traiter comme une strate à part) toute unité pour laquelle nψi 1. Ensuite on
détermine une valeur z* telle que pour tout i, nψi Ri = Qi + z*. À l’étape i, on inclut l’unité i avec probabilité
(n-ni)ψi/Ri . Les conditions suivantes sont alors satisfaites :
πi = nψi/R1 = nψi/(1+z*);
π1j =
()
1
2
(1)
1*
j
nn
zR
−ψψ
+; πij =
()
1
12
23
1
(1) 1 1 ... 1
1*
ij i
i
i
nn
RR R
zR
+
−ψψ ψ
ψψ


−− −


+

i < j.
L’inconvénient de cette méthode est qu’il est possible qu’à la Ne (et dernière) étape on n’ait pas obtenu un
échantillon de taille n. Dans certaines circonstances, cette possibilité peut être éliminée. Une condition suffisante est
la suivante :
Cas particulier S’il est possible d’ordonner les unités de la population de telle sorte que la condition nψi Qi soit
respectée ; et que ψN-n+1 = ψN-n+2 = …= ψN, alors on peut prendre z* = 0 et l’échantillon sera toujours de taille n.
Tirage systématique de grappes
Une façon de tirer des grappes avec probabilités proportionnelles aux Mi consiste à tirer un échantillon systématique
de K = unités secondaires — et d'inclure dans l'échantillon toute unité primaire contenant les unités secon-
daires choisies.
=
N
ii
M
1
Par exemple, considérons une population de 40 unités primaires dont les valeurs des Mi sont:
2
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Mi 7 4 7 12 5 8 3 4 8 4 3 4 8 2 1 3 4 2 5 3 3 3 4 4 9 5 4 3 3 3 5 4 7 2 3 2 3 2 2 2
Tirage systématique de 10 ménages dans une population de 40 ménages
Unité
Échantillon # 1 2 3 4 5 6 7 8 9
n = 10
1 1 3 5 9 12 17 22 25 30 33
2 1 4 6 9 13 17 23 26 30 34
3 1 4 6 9 13 18 23 26 31 34
4 1 4 6 9 13 18 23 26 31 35
5 1 4 6 9 13 19 23 26 31 35
6 1 4 6 9 13 19 24 26 31 35
7 1 4 6 9 13 19 24 27 31 36
8 2 4 6 10 13 19 24 27 32 36
9 2 4 6 10 13 19 24 27 32 37
10 2 4 7 10 14 20 25 27 32 37
11 2 4 7 10 14 20 25 28 32 37
12 3 4 7 11 15 20 25 28 33 38
13 3 4 8 11 16 21 25 28 33 38
14 3 5 8 11 16 21 25 29 33 39
15 3 5 8 12 16 21 25 29 33 39
16 3 5 8 12 17 22 25 29 33 40
r = 17 3 5 9 12 17 22 25 30 33 40
Le premier échantillon, par exemple, est constitué des unités 1, 3 , 5, 9 , 12 , 17 , 22 , 25 , 30 , et 33.
Chaque unité primaire (chaque ménage) se situe dans autant d'échantillons qu'il contient d'unités secondaires.
En général, nous n'avons pas la garantie qu'une unité ne sera pas tirée plus d'une fois. Supposons que K = nr. Alors
toute unité primaire i pour laquelle Mi > r paraîtra plus d’une fois dans certains échantillons.
Méthode de Rao-Hartley-Cochran
Une variable auxiliaire X sert à sélectionner les unités primaires. Soit ψi = xi/tx, où tx = 1
N
i
i
x
=
. La procédure de
tirage est la suivante : On répartit les unités de la population en n groupes de tailles (fixes) N1, …, Nn. Ensuite, on
tire une unité dans chaque groupe, avec probabilités proportionnelles aux xi du groupe, c’est-à-dire, l’unité i est
sélectionnée avec probabilité
g
i
x
t est la somme des X du groupe g. L’estimateur du total de la population est
ˆ
R
HT
t = 1/
g
ng
g
g
x
y
x
t
=
, où yg et xg sont les valeurs de Y et de X de l’unité sélectionnée dans le groupe.
L’estimateur est sans biais, sa variance est
2
1
1
(1)
ˆ
() (1)
n
gg N
g
j
i
RHC i j
iji ij
NN y
y
Vt NN
=
=>


∑∑ ψ
ψψ
, et un estimateur sans biais de la variance est
2
1
1
22
1
(1)
ˆˆˆ
() g
n
gg x
n
gg
RHC RHT
ngxg
g
g
NN ty
Vt t
tx
NN
=
=
=

=−



.
3
1 / 3 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !