Intervalle de fluctuation – Intervalle de confiance - Estimation d'une proportion I Intervalles de fluctuation de la fréquence 1°) Rappels Soit un échantillon contenant n individus ayant un caractère dont la proportion p (la probabilité) est connue. On connaît déjà deux intervalles de fluctuation de la fréquence : – un, étudié en seconde : n25 et 0,2 p0,8 alors, la fréquence f d'un caractère appartient à l'intervalle Si [ p− 1 1 , p+ √n √n ] avec une probabilité au moins égale à 95%, on dit au seuil de 95% – un, étudié en première : On considère la variable aléatoire X donnant le nombre de fois que le caractère observé est obtenu, X suit une loi binomiale de paramètres n et p. [ ] a b , où : n n p X ≤a 0,025 p X ≤b≥0,975 . L'intervalle de fluctuation de la fréquence f au seuil de 95% est - a est la plus petite valeur de X pour laquelle - b est la plus petite valeur de X pour laquelle Il reste à en découvrir un autre appelé intervalle de fluctuation asymptotique. 2°) Intervalle de fluctuation asymptotique On s'intéresse au caractère d'une population dont on connaît la probabilité p. A chaque échantillon de la population de taille n la variable aléatoire X n qui donne le nombre d'individus qui vérifie ce caractère suit une loi binomiale de paramètres n et p. Xn correspond à la variable aléatoire fréquence qui, à tout échantillon de taille n, associe la fréquence obtenue. n Propriété Si la variable aléatoire X n suit la loi binomiale B(n,p), alors, pour tout α∈ ] 0 , 1 [ on a : Xn √ p (1− p) , p+ u √ p (1− p) p−uα lim P ∈I n =1−α où I n désigne l'intervalle α n n ∞ √n √n u α étant l'unique réel tel que P (−uα ≤Z≤u α )=1−α , Z suit la loi normale N(0,1). [ ] . Démonstration : –-------------------------------------------------------------------------------------------------------------------------------------------------------Définition L'intervalle de fluctuation asymptotique de la fréquence au seuil de 95% est [ p−1,96 ] p 1− p p 1− p , p1,96 . n n On peut faire cette approximation lorsque n≥30 , np≥5 et n 1− p≥5 . Remarque : en majorant 1,96 p 1− p par 1 on obtient l'intervalle de fluctuation donné en seconde. 3°) Prise de décision aux conditions n≥30 , np≥5 et n (1− p)≥5 Tester un échantillon Si la probabilité p d'obtention d'un caractère d'une population est connue on peut tester si un échantillon de taille n de la population est représentatif de celle-ci concernant ce caractère. On détermine la fréquence f du caractère étudié dans l'échantillon. Si [ f ∈ p−1,96 p1− p p 1− p , p1,96 n n ] on peut considérer que l'échantillon est représentatif au seuil de 95%. Tester une proportion Si la proportion p d'obtention d'un caractère d'une population est estimée on peut rejeter ou non cette estimation. On détermine la fréquence f du caractère étudié dans un échantillon de taille n de la population. Si [ f ∈ p−1,96 p1− p p 1− p , p1,96 n n ] on peut accepter l'estimation de la proportion p au seuil de 95%. II Intervalle de confiance de la proportion p - Estimation d'une proportion – Taille d'un échantillon Propriété : Si la variable aléatoire X n suit la loi binomiale B(n,p) et si F n est la variable aléatoire fréquence assez grand l'intervalle [ F n− 1 1 , F n+ √n √n ] Xn alors pour n n contient la proportion p avec une probabilité au moins égale à 0,95. Démonstration : –-----------------------------------------------------------------------------------------------------------------------------Définition d'un intervalle de confiance de la proportion au seuil de 95 % On ne connaît pas la proportion p d'un caractère d'une population. On connaît la fréquence f de ce caractère déterminée sur un échantillon de taille n. On appelle intervalle de confiance de la proportion inconnue p avec un niveau de confiance de 95% l'intervalle [ ] 1 1 , f . C'est-à-dire que n n , np≥5 et n (1− p)≥5 . f− [ p∈ f − 1 1 , f n n ] avec un niveau de confiance de 95% lorsque n≥30 Utilisation : Estimer une proportion p avec un niveau de confiance de 95% à partir d'une fréquence f déterminée sur un échantillon de taille n. En connaissant f et n on peut déterminer l'intervalle auquel appartient p avec un niveau de confiance de 95%. [ p∈ f − 1 1 ,f+ √n √n ] Déterminer la taille n d'un échantillon pour obtenir avec une précision donnée une estimation de la proportion d'un caractère d'une population au niveau de confiance de 95%. L'intervalle de confiance ayant une amplitude confiance d'amplitude a on calcule n sachant que 1 1 2 – ( f − )= √n √n √n 4 2 ≤a soit n≥ 2 . a √n a= f + , si on veut déterminer un intervalle de