CoursSTT2000Sect2planSI

publicité
Échantillonnage (STT-2000)
Section 2
Tirage aléatoire simple (plan SI).
Version: 22 août 2003
Plan aléatoire simple sans remise



2
Ce plan est tel que tout échantillon de taille n,
où n est déterminée à l’avance, possède la
même probabilité.
Ce tirage est essentiellement ce que l’on a en
tête quand on tire dans une urne n boules
sans remise qui sont bien mélangées et
indétectable au toucher.
En pratique, il faut des algorithmes pour mettre
en œuvre ce plan.
STT-2000; Échantillonnage
Fonction de probabilité

1
ps   


3
N
  si s est de taille n
n
0
sinon.
STT-2000; Échantillonnage
Probabilités d’inclusion d’ordre 1

Toutes les unités ont la même probabilité
d’inclusion:
1 N  1
 

1 n  1 
n

ps  k  

k
N
N
 
n
4
STT-2000; Échantillonnage
Probabilité d’inclusion d’ordre 2
 2  N  2 
 

2  n  2  nn  1

ps  k , l  

  lk , k  l
N N  1
N
 
n
5
STT-2000; Échantillonnage
Algorithmes pour la mise en œuvre
du tirage SI

Deux types d’algorithmes:
–
–
6
Par une série de tirages, où chaque tirage donne
une unité incluse, jusqu’à la taille désirée n.
Par une série d’expériences, une pour chaque unité
dans la base de sondage, selon l’ordre défini par
cette base de sondage particulière. L’expérience
pour l’unité k donne soit le résultat « unité incluse »
ou « unité non incluse ».
STT-2000; Échantillonnage
Exemple d’algorithme du premier
type







7
Tirer la première unité en donnant une probabilité 1/N
à toutes les unités.
Ne pas remettre l’unité choisie.
Tirer la seconde unité en donnant une probabilité de
1/(N-1) aux unités restantes.
Ne pas remettre l’unité choisie.
…
Tirer la nième unité en donnant la probabilité 1/(N-n+1) à
toutes les unités restantes.
Fin.
STT-2000; Échantillonnage
Second exemple d’un algorithme
du premier type





8
Tirer la première unité en donnant un
probabilité de 1/N à toutes les unités.
Noter l’unité et remettre l’unité.
Répéter jusqu’à ce que l’on ait obtenu n unités
distinctes.
Il faut ainsi un nombre d’essais valant
et
satisfaisant
n
Le nombre de tirage est aléatoire.

STT-2000; Échantillonnage

Premier exemple d’un algorithme
du second type (SSW, p.12)





9
Soient u1,u2,…,uN des réalisations d’une
variable aléatoire U(0,1).
Si u1 < n/N, alors l’unité k=1 est incluse.
…
Si uk < (n-nk)/(N-k+1), où nk = nombre
d’éléments choisis parmi les k-1 éléments dans
la liste de la population.
La procédure arrête quand nk = n.
STT-2000; Échantillonnage
Second exemple d’un algorithme
du second type



10
Soient u1,u2,…,uN des réalisations d’une
variable aléatoire U(0,1).
Trier les nombres obtenus par ordre croissant:
u(1) < u(2) < … < u(N)
Les unités retenues correspondent aux indices
des n premiers individus de la liste triée.
STT-2000; Échantillonnage
Exemple avec runif()


Population de taille N = 10
On veut un échantillon de taille n = 3
k
1
2
3
4
5
6
7
8
9
10
unif
0,00125126
0,56358531
0,19330424
0,8087405
0,58500931
0,47987304
0,35029145
0,8959624
0,82284005
0,74660482
Après avoir
trié selon les
nombres de
la colonne
unif
L’échantillon est {1,3,7}
11
STT-2000; Échantillonnage
k
1
3
7
6
2
5
10
4
9
8
unif
0,00125126
0,19330424
0,35029145
0,47987304
0,56358531
0,58500931
0,74660482
0,8087405
0,82284005
0,8959624
Téléchargement