Chapitre 17 Estimations et échantillonnages. I Intervalle de fluctuation asymptotique. 1 L’intervalle de fluctuation pour une variable aléatoire qui suit une loi binomiale. X est une variable aléatoire qui suit la loi binomiale B(n; p). On note F la suite définie sur les entiers 0, 1, · · · , n, par F (K) = P (X 6 K). Dans votre calculatrice cette fonction F est dans l’écran des distributions, DISTR , B :binomFRép. Utilisons le programme ci-dessous : Algorithme : Entrée : On demande le nombre d’essais N et la probabilité d’un succès P. Initialisation : la variable K prend la valeur 0 Traitement 1 : Tant Que F (K) < 0, 025 la variable K prend la valeur K+1 Fin du Tant Que Affichage 1 : on affiche K Traitement 2 : Tant Que F (K) 6 0, 975 la variable K prend la valeur K+1 Fin du Tant Que Affichage 2 : on affiche K Programme pour Texas Instrument Input "NB ESSAIS : ",N Input "PROBA SUCCES : ",P 0 →K While binomFRép(N,P,K) < 0.025 K+1 →K End Disp "A=",K While binomFRép(N,P,K) 60.975 K+1 →K End Disp "B=",K Que réalise ce programme, cet algorithme ? Vous pouvez l’utiliser avec la variable aléatoire X qui suit la loi B(100; 0, 6). Ainsi, les nombres A et B affichés vérifient : 177 CHAPITRE 17. ESTIMATIONS ET ÉCHANTILLONNAGES. 178 w P (X < A) < 0, 025 et P (X 6 A) > 0, 025. soit ici w P (X < · · · ) < 0, 025 et P (X 6 · · · ) > 0, 025. w P (X 6 B) 6 0, 975 et P (X > B) > 0, 975. w P (X 6 · · · ) 6 0, 975 et P (X > · · · ) > 0, 975. w Ainsi P (A 6 X 6 B) > 0, 95. w Ainsi P (· · · · · · 6 X 6 · · · · · · ) > 0, 95. X X , donc, avec l’exemple précédent, F = . Cette variable aléatoire n 100 représente les fréquences de la variable aléatoire X. Avec les notation précédentes : On définit la variable aléatoire F par F = A 6X6 A X 6 6 n n Ainsi, P B A 6F 6 n n B B n A B > 0, 95. On peut aussi écrire en utilisant un intervalle P F ∈ ; > 0, 95. n n Définition Cet intervalle est l’intervalle de fluctuation de F au seuil de 95%. Donner l’intervalle de fluctuation obtenue avec le programme précédent : ⋆ Remarque Si on définit une suite de variables aléatoires Xn où n est un entier naturel strictement positif, Xn suivant la loi binomiale B(n; p), on obtient ainsi une suite d’intervalles au seuil de 95%. Le problème ici, c’est que nous n’avons aucune formule explicite qui permette de déterminer cette suite d’intervalles. 2 Avec le théorème de Moivre-Laplace. On rappelle ce théorème : ♣ Théorème p est un nombre réel de l’intervalle ]0; 1[. Z est une variable aléatoire qui suit la loi normale N (0; 1). 6 On définit une suite de variables aléatoires Xn où n est un entier naturel strictement positif. Quel que soit le nombre entier naturel n > 1, Xn suit la loi binomiale B(n; p p). 6 Pour tout entier naturel n, µ = Xn = np et σ = np(1 − p). Xn − np 6 Pour tout entier n > 1, on note Zn la variable centrée réduite associée à la variable aléatoire Xn , Zn = p . np(1 − p) Alors, quels que soient les nombres réels a et b (a < b), lim P (a < Zn < b) = P (a < Z < b) = n→+∞ Z a b 1 x2 √ e− 2 dx 2π I. INTERVALLE DE FLUCTUATION ASYMPTOTIQUE. 179 On peut réécrire ce théorème en introduisant la suite de variables aléatoires (Fn ) définie pour tout entier n > 1 par Xn , pour un encadrement du type −u < Zn < u. On a alors : Fn = n w On note alors que : ! Xn − np P (−u < Zn < u) = P −u < p <u np(1 − p) p p P (−u < Zn < u) = P −u np(1 − p) < Xn − np < u np(1 − p) p p P (−u < Zn < u) = P np − u np(1 − p) < Xn < np + u np(1 − p) ! p p np(1 − p) np(1 − p) < Fn < p + u P (−u < Zn < u) = P p − u n n ! p p p(1 − p) p(1 − p) √ √ < Fn < p + u P (−u < Zn < u) = P p − u n n w En écrivant ces inégalités sous forme d’intervalle, on obtient : " #! p p p(1 − p) p(1 − p) √ √ P (Zn ∈ [−u; u]) = P Fn ∈ p − u ;p + u n n w On peut alors appliquer le théorème de Moivre-Laplace : ! p p p(1 − p) p(1 − p) √ √ p−u < Fn < p + u = P (−u < Z < u) n n lim P n→+∞ Où bien, avec des intervalles : " #! p p p(1 − p) p(1 − p) √ √ Fn ∈ p − u ;p + u = P (Z ∈ [−u; u]) n n lim P n→+∞ On rappelle que Z suit la loi normale N (0; 1). ♣ Théorème p est un nombre réel de l’intervalle ]0; 1[.Z est une variable aléatoire qui suit la loi normale N (0; 1). 6 On définit une suite de variables aléatoires Xn où n est un entier naturel strictement positif. Quel que soit le nombre entier naturel n > 1, Xn suit la loi binomiale B(n; p). Xn 6 La suite de variables aléatoires (Fn ) est définie pour tout entier n > 1 par Fn = . n 6 α est un nombre réel, 0"< α < 1. On note u l’unique réel qui # vérifie P (−u 6 Z 6 u) = 1 − α. p p p(1 − p) p(1 − p) √ √ 6 On note In l’intervalle p − u ;p + u . n n Alors lim P (Fn ∈ In ) = P (−u < Z < u) = 1 − α. n→+∞ Définition L’intervalle In = " # p p p(1 − p) p(1 − p) √ √ p−u ;p + u est l’intervalle de fluctuation asymptotique de n n Xn au seuil de 1 − α. C’est à dire que, Fn appartient à l’intervalle In avec une probabilité proche de 1 − α. n En utilisant le cours sur la loi normale N (0; 1) : 6 avec α = 0, 05, on a vu que u = 1, 96 ; 6 avec α = 0, 01, on a vu que u = 2, 58. Fn = On obtient deux intervalles de fluctuation asymptotiques de référence : CHAPITRE 17. ESTIMATIONS ET ÉCHANTILLONNAGES. 180 6 In de Fn 6 In de Fn " # p p p(1 − p) p(1 − p) √ √ = p − 1, 96 ; p + 1, 96 est l’intervalle de fluctuation asymptotique n n Xn = au seuil de 95% ; n " # p p p(1 − p) p(1 − p) √ √ = p − 2, 58 ; p + 2, 58 est l’intervalle de fluctuation asymptotique n n Xn = au seuil de 99% n On peut l’illustrer avec un tableur : Exercice sur le livre : faire l’exercice n◦ 7 page 444. 3 L’intervalle de fluctuation vu en seconde. ⋆ Remarque On note que les bornes supérieures et inférieures des intervalles de fluctuation asymptotiques au seuil p de 95% dépendent de la fonction f : p 7−→ 1, 96 p(1 − p) où 0 < p < 1. On peut étudier cette fonction pour la majorer. I. INTERVALLE DE FLUCTUATION ASYMPTOTIQUE. 181 1.0 0.8 0.6 0.4 0.2 −0.2 0.2 0.4 0.6 0.8 1.0 −0.2 On peut voir sur la représentation graphique p de f que le maximum est inférieur à 1. On fait une étude des variations pour le prouver. On note que f (p) = 1, 96 p − p2 . 1 − 2p f ′ (p) = 1, 96 p . On voit que cette dérivée est du signe de 1 − 2p. 2 p − p2 Le tableau de variation de f est : p 1 2 0 signe de f ′ (p) + ✸ ✑✑ f (p) 0 1 f 2 0 1 − ◗◗ s 0 r 1 1 1 1 Le maximum est f = 1, 96 − = 1, 96 × = 0, 98. 2 2 4 2 p 1 1 Ainsi, pour tout p ∈]0; 1[, 1, 96 p(1 − p) < 1. L’intervalle Jn = p − √ ; p + √ contient l’intervalle In . L’intervalle n n de fluctuation du cours de seconde est plus grand que celui de terminale, c’est pourquoi : 1 1 P Fn ∈ p − √ ; p + √ > 0, 95 n n 4 En pratique. 6 Ces intervalles de fluctuation asymptotique peuvent être utilisés dès que n > 30, np > 5 et n(1 − p) > 5. 6 On les utilise aussi quand on veut estimer si une probabilité p0 est égale où pas à une valeur donnée connue autrement p. Autrement dit, est ce que l’hypothèse p = p0 est vraie ou pas ? La méthode de prise de décision au seuil de 95 % est la suivante : CHAPITRE 17. ESTIMATIONS ET ÉCHANTILLONNAGES. 182 6 On vérifie que les conditions n > 30, np > 5 et n(1 − p) > 5 sont bien remplies. " # p p p(1 − p) p(1 − p) √ √ 6 On calcule l’intervalle de fluctuation In = p − 1, 96 ; p + 1, 96 . n n 6 On calcule, si on ne l’a pas déjà fait la fréquence f observée. " # p p p(1 − p) p(1 − p) √ √ 6 Si f ∈ p − 1, 96 ; p + 1, 96 , on accepte l’hypothèse que p0 = p, au seuil n n de 95% " # p p p(1 − p) p(1 − p) √ √ 6f ∈ / p − 1, 96 ; p + 1, 96 , on rejette l’hypothèse que p0 = p. Ce faisant, n n comme 5% des fréquences sont en dehors de l’intervalle, on a 5% de chance de se tromper. Exercices sur le livre : faire les exercices n◦ 9, n◦ 10 et n◦ 13 page 445. II Intervalle de confiance. Un intervalle de confiance s’utilise quand on ne connait pas la probabilité p (ou ce qui revient au même, de la proportion p d’un caractère dans une population) mais qu’on veut l’estimer. On observe donc une fréquence f , sur un échantillon de taille n, pour estimer une probabilité, une proportion. Il suffit pour cela de « retourner » l’inégalité 1 1 p− √ 6f 6p+ √ . n n Première inégalité. 1 p− √ n 6 f p 6 1 f+√ n Seconde inégalité. f 6 1 p+ √ n 1 f−√ n 6 p 1 1 1 1 On remarque que f − √ 6 p 6 f + √ , ou bien, en traduisant en intervalle, p ∈ f − √ ; f + √ . On a donc n n n n démontré que : 1 1 1 1 f ∈ p − √ ;p + √ est équivalent à p ∈ f − √ ; f + √ n n n n Ainsi : 1 1 √ √ ♣ Théorème Il existe un rang n0 à partir duquel P p ∈ f − ;f + > 0, 95. n n 1 1 Définition L’intervalle f − √ ; f + √ est un intervalle de confiance à 95% de la probabilité (ou de la proporn n tion) p. Exercices sur le livre : faire les exercices n◦ 16, n◦ 18 et n◦ 20 page 446.