TP 4 STT2000 : Échantillonnage À remettre le 1 octobre 2010 1. (12 points) Dans une population de 4000 individus, on cherche à estimer deux proportions. p1 = proportion d’individus possédant un lave-vaisselle p2 = proportion d’individus possédant un ordinateur portable Nous avons une information a priori concernant les valeurs de p1 et p2 . On sait que 0.45 ≤ p1 ≤ 0.65 et 0.05 ≤ p2 ≤ 0.1 . Déterminez la taille n de l’échantillon dans le cas de l’EASSR si on veut connaitre simultanément p1 and p2 avec une marge d’erreur de 2% et 1%, respectivement et un niveau de confiance de 95%. 2. Exercice no. 7 page 63 dans Lohr. 3. Montrer que pour un plan à taille fixe, on a ∑π i =n. i∈U Indice: Utiliser les variables indicatrices de sélection Z i . 4. On cherche à estimer le total dans la population (de taille N) d’une variable y, t y . Pour cela, on décide de comparer deux procédures d’échantillonnage: l’échantillonnage aléatoire simple sans remise (échantillon de taille n) et le plan de Bernoulli avec π = n N . On utilise l’estimateur de Horvitz-Thompson pour estimer t y . Soit VBE ( tˆy ) la variance de l’estimateur sous le plan de Bernoulli et VEASSR ( tˆy ) la variance de l’estimateur sous le plan EASSR. Montrez que VBE ( tˆy ) 1 N −1 = + , 2 ˆ N VEASSR ( t y ) CV ( y ) où CV ( y ) = S y yU désigne le coefficient de variation de la variable y (le coefficient de variation d’une variable est simplement une mesure de sa dispersion standardisée qui n’a pas d’unité et que l’on peut exprimer en pourcentage). Ce résultat montre qu’un plan Bernoulli est très souvent moins efficace que l’EASSR. Quelle en est la raison? Dans quelle situation un plan Bernoulli est plus efficace que l’EASSR? 5. Soit s un échantillon aléatoire obtenu à l’aide un plan BE avec probabilité π dans une population de taille N. Soit ns la taille (aléatoire) de s. Montrer que la probabilité conditionnelle d’obtenir s étant donné ns = n (i.e., P ( s ns = n ) ), est égale à la probabilité d’un EASSR de taille n tiré d’une population de taille N. Ce résultat suggère une méthode permettant de tirer un EASSR de taille n. Laquelle? Indice : utilisez la définition de probabilité conditionnelle d’un événement A étant donné un événement B.