Tirage de grappes avec probabilités proportionnelles aux tailles

publicité
Tirages de grappes avec probabilités proportionnelles aux tailles
Méthode des effectifs cumulés [n = 1]
Une façon de tirer une unité primaire i avec probabilités proportionnelles aux tailles Mi est la suivante. On divise
l'intervalle [0,1) en N intervalles dont les bornes sont
0,
où K =
∑i=1M i
N
M1 M1 + M 2
M + M 2 + M3
M + M 2 + ... + M N −1
,
, 1
,…, 1
,1
K
K
K
K
et N est le nombre de grappes.
Ensuite on génère un nombre entre 0 et 1 et on tire la grappe i si le nombre généré se situe dans le ie intervalle.
Exemple:
Le tableau suivant illustre comment tirer une observation d'une population de 20 ménages avec probabilités
proportionnelles aux nombres de personnes dans les ménages
Tirage de grappes avec probabilités proportionnelles aux tailles
Tirage d’un ménage dans une population de 20 ménages
Ménage
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Taille
(Mi)
Cumul
(Mi )
Cumul relatif
(Cumul/K)
Intervalle
3
5
2
4
3
2
4
4
2
1
3
5
2
6
4
3
7
2
3
8
K =73
3
8
10
14
17
19
23
27
29
30
33
38
40
46
50
53
60
62
65
73
0,0411
0,1096
0,1370
0,1918
0,2329
0,2603
0,3151
0,3699
0,3973
0,4110
0,4521
0,5205
0,5479
0,6301
0,6849
0,7260
0,8219
0,8493
0,8904
1,0000
0,0000- 0,0411
0,0411- 0,1096
0,1096- 0,1370
0,1370- 0,1918
0,1918- 0,2329
0,2329- 0,2603
0,2603- 0,3151
0,3151- 0,3699
0,3699- 0,3973
0,3973- 0,4110
0,4110- 0,4521
0,4521- 0,5205
0,5205- 0,5479
0,5479- 0,6301
0,6301- 0,6849
0,6849- 0,7260
0,7260- 0,8219
0,8219- 0,8493
0,8493- 0,8904
0,8904- 1,0000
Lorsqu'on tire un échantillon de taille n avec remise et probabilités proportionnelles aux Mi, chaque unité est tirée de
cette même façon.
Méthode de Lahiri [n = 1]
Soit M ≥ max{M1,…,MN}.
a.
b.
c.
d.
On tire une unité au hasard, avec probabilités 1/N. Soit i l’unité tirée et Mi sa taille.
On génère un nombre aléatoire u de loi uniforme sur [0 ; M).
Si u ≤ Mi, l’unité i est conservée.
Si u > Mi, on rejette l’unité tiré et on recommence à l’étape a.
Méthode de Sunter [Applied Statistics, 26, (1977), 261-268; et Int. Statist. Rev.,54, (1986), 33-50]
Méthode 1
L’objectif est de tirer un échantillon de taille n sans remise avec probabilités d’inclusion πi (i = 1, … , N) proportionnelles à des tailles ψi (i = 1,…, N) telles que
< nψi ≤ 1 pour tout i. Soit Qi =
a.
b.
c.
d.
∑
N
i =1
ψi
= 1. Les πi satisfont alors πi = nψi. Nous supposons donc que 0
∑ j =i ψ j .
N
Au pas 1, la première unité est retenue avec probabilité π1.
Au pas 2, la 2e unité est sélectionnée avec probabilité nψ2/(1-ψ1) si l’unité 1 n’a pas été sélectionnée; et
avec probabilité (n-1)ψ2/(1-ψ1) si l’unité 1 a été sélectionnée.
n − ni
Supposons les i-1 premiers pas réalisés. Au pas i, on sélectionne l’unité i avec probabilité
ψi , où ni
Qi
est le nombre d’unités sélectionnées jusqu’au pas i-1.
La procédure se termine lorsque ni = n.
En d’autres termes chaque étape est une répétition du pas 1 : après la ie étape, il reste n-ni à sélectionner d’une popuψ
ψ
lation dont les unités i, … , N ont des poids i ,..., N .
Qi
Qi
Il est possible, cependant, que la procédure doive s’arrêter avant que ni soit égal à n, car il peut arriver que
n − ni
n − ni*
ψi > 1. Si i* la première valeur de i pour laquelle
ψi* >1, alors on tire un échantillon aléatoire simple
Qi
Qi*
de n-ni* de la population constituée des unités i*, … , N. On a alors les résultats suivants :
•
πi = nψi pour 1 ≤ i < i* et πi =
•
•
πij > 0, i < j ≤ N
πiπj-πij > 0 , i < j ≤ N
n
Q pour i* ≤ i ≤ N
N − i * +1 i *
L’évaluation des πij demeure compliquée, sauf pour i < j < i*. Dans ce cas on a
•
πij =
n( n − 1)ψi ψ j 
ψi −1 
ψ1  
ψ2  
1 − Q  1 − Q  ... 1 − Q  .
Qi +1

2 
3 
i 
Méthode 2
Une deuxième méthode de Sunter permet d’éviter certaines des difficultés de la première. On commence par
extraire de la population (pour les traiter comme une strate à part) toute unité pour laquelle nψi ≥ 1. Ensuite on
détermine une valeur z* telle que pour tout i, nψi ≤ Ri = Qi + z*. À l’étape i, on inclut l’unité i avec probabilité
(n-ni)ψi/Ri . Les conditions suivantes sont alors satisfaites :
πi = nψi/R1 = nψi/(1+z*);
π1j =
n(n − 1)ψ1ψ j
(1 + z *) R2
; πij =
n(n − 1)ψi ψ j  ψ1   ψ2   ψi −1 
1−
1−
... 1 −
i < j.
Ri 
(1 + z *) Ri +1  R2   R3  
L’inconvénient de cette méthode est qu’il est possible qu’à la Ne (et dernière) étape on n’ait pas obtenu un
échantillon de taille n. Dans certaines circonstances, cette possibilité peut être éliminée. Une condition suffisante est
la suivante :
Cas particulier S’il est possible d’ordonner les unités de la population de telle sorte que la condition nψi ≤ Qi soit
respectée ; et que ψN-n+1 = ψN-n+2 = …= ψN, alors on peut prendre z* = 0 et l’échantillon sera toujours de taille n.
Tirage systématique de grappes
Une façon de tirer des grappes avec probabilités proportionnelles aux Mi consiste à tirer un échantillon systématique
de K =
∑i =1M i
N
unités secondaires — et d'inclure dans l'échantillon toute unité primaire contenant les unités secon-
daires choisies.
Par exemple, considérons une population de 40 unités primaires dont les valeurs des Mi sont:
2
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Mi 7 4 7 12 5 8 3 4 8 4 3 4 8 2 1 3 4 2 5 3 3 3 4 4 9 5 4 3 3 3 5 4 7 2 3 2 3 2 2 2
Tirage systématique de 10 ménages dans une population de 40 ménages
Unité
Échantillon #
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
r = 17
1
1
1
1
1
1
1
1
2
2
2
2
3
3
3
3
3
3
2
3
4
4
4
4
4
4
4
4
4
4
4
4
5
5
5
5
3
5
6
6
6
6
6
6
6
6
7
7
7
8
8
8
8
9
4
9
9
9
9
9
9
9
10
10
10
10
11
11
11
12
12
12
5
12
13
13
13
13
13
13
13
13
14
14
15
16
16
16
17
17
6
17
17
18
18
19
19
19
19
19
20
20
20
21
21
21
22
22
7
22
23
23
23
23
24
24
24
24
25
25
25
25
25
25
25
25
8
25
26
26
26
26
26
27
27
27
27
28
28
28
29
29
29
30
9
30
30
31
31
31
31
31
32
32
32
32
33
33
33
33
33
33
n = 10
33
34
34
35
35
35
36
36
37
37
37
38
38
39
39
40
40
Le premier échantillon, par exemple, est constitué des unités 1, 3 , 5, 9 , 12 , 17 , 22 , 25 , 30 , et 33.
Chaque unité primaire (chaque ménage) se situe dans autant d'échantillons qu'il contient d'unités secondaires.
En général, nous n'avons pas la garantie qu'une unité ne sera pas tirée plus d'une fois. Supposons que K = nr. Alors
toute unité primaire i pour laquelle Mi > r paraîtra plus d’une fois dans certains échantillons.
Méthode de Rao-Hartley-Cochran
Une variable auxiliaire X sert à sélectionner les unités primaires. Soit ψi = xi/tx, où tx =
∑ i =1 xi . La procédure de
N
tirage est la suivante : On répartit les unités de la population en n groupes de tailles (fixes) N1, …, Nn. Ensuite, on
tire une unité dans chaque groupe, avec probabilités proportionnelles aux xi du groupe, c’est-à-dire, l’unité i est
x
sélectionnée avec probabilité i est la somme des X du groupe g. L’estimateur du total de la population est
tx
g
tˆ
RHT
=
yg
∑ g =1 xg / tx
n
, où yg et xg sont les valeurs de Y et de X de l’unité sélectionnée dans le groupe.
g
L’estimateur est sans biais, sa variance est
∑ g =1 Ng ( Ng − 1)
)=
n
V (tˆRHC
N ( N − 1)
∑ i =1 ∑
N
yj
y
ψi ψ j  i −
 ψi ψ j
j >i

2
N ( N g − 1)
∑

n tx  yg
g =1 g
ˆ
V (tˆRHC ) =
∑ g =1 tx  xg − tˆRHT  .
n
N2 − ∑
N g2
g =1
n
g
3
2

 , et un estimateur sans biais de la variance est

Téléchargement