Échantillonnage (STT-2000) Section 2 Tirage aléatoire simple (plan SI). Version: 22 août 2003 Plan aléatoire simple sans remise 2 Ce plan est tel que tout échantillon de taille n, où n est déterminée à l’avance, possède la même probabilité. Ce tirage est essentiellement ce que l’on a en tête quand on tire dans une urne n boules sans remise qui sont bien mélangées et indétectable au toucher. En pratique, il faut des algorithmes pour mettre en œuvre ce plan. STT-2000; Échantillonnage Fonction de probabilité 1 ps 3 N si s est de taille n n 0 sinon. STT-2000; Échantillonnage Probabilités d’inclusion d’ordre 1 Toutes les unités ont la même probabilité d’inclusion: 1 N 1 1 n 1 n ps k k N N n 4 STT-2000; Échantillonnage Probabilité d’inclusion d’ordre 2 2 N 2 2 n 2 nn 1 ps k , l lk , k l N N 1 N n 5 STT-2000; Échantillonnage Algorithmes pour la mise en œuvre du tirage SI Deux types d’algorithmes: – – 6 Par une série de tirages, où chaque tirage donne une unité incluse, jusqu’à la taille désirée n. Par une série d’expériences, une pour chaque unité dans la base de sondage, selon l’ordre défini par cette base de sondage particulière. L’expérience pour l’unité k donne soit le résultat « unité incluse » ou « unité non incluse ». STT-2000; Échantillonnage Exemple d’algorithme du premier type 7 Tirer la première unité en donnant une probabilité 1/N à toutes les unités. Ne pas remettre l’unité choisie. Tirer la seconde unité en donnant une probabilité de 1/(N-1) aux unités restantes. Ne pas remettre l’unité choisie. … Tirer la nième unité en donnant la probabilité 1/(N-n+1) à toutes les unités restantes. Fin. STT-2000; Échantillonnage Second exemple d’un algorithme du premier type 8 Tirer la première unité en donnant un probabilité de 1/N à toutes les unités. Noter l’unité et remettre l’unité. Répéter jusqu’à ce que l’on ait obtenu n unités distinctes. Il faut ainsi un nombre d’essais valant et satisfaisant n Le nombre de tirage est aléatoire. STT-2000; Échantillonnage Premier exemple d’un algorithme du second type (SSW, p.12) 9 Soient u1,u2,…,uN des réalisations d’une variable aléatoire U(0,1). Si u1 < n/N, alors l’unité k=1 est incluse. … Si uk < (n-nk)/(N-k+1), où nk = nombre d’éléments choisis parmi les k-1 éléments dans la liste de la population. La procédure arrête quand nk = n. STT-2000; Échantillonnage Second exemple d’un algorithme du second type 10 Soient u1,u2,…,uN des réalisations d’une variable aléatoire U(0,1). Trier les nombres obtenus par ordre croissant: u(1) < u(2) < … < u(N) Les unités retenues correspondent aux indices des n premiers individus de la liste triée. STT-2000; Échantillonnage Exemple avec runif() Population de taille N = 10 On veut un échantillon de taille n = 3 k 1 2 3 4 5 6 7 8 9 10 unif 0,00125126 0,56358531 0,19330424 0,8087405 0,58500931 0,47987304 0,35029145 0,8959624 0,82284005 0,74660482 Après avoir trié selon les nombres de la colonne unif L’échantillon est {1,3,7} 11 STT-2000; Échantillonnage k 1 3 7 6 2 5 10 4 9 8 unif 0,00125126 0,19330424 0,35029145 0,47987304 0,56358531 0,58500931 0,74660482 0,8087405 0,82284005 0,8959624