Leçon 12 – Intervalle de Fluctuation Pré requis : - Epreuve et schéma de Bernoulli - Loi Binomiale - Loi Normale et théorème Moivre – Laplace I) Généralités et fluctuation d’échantillonnage L’étude de la loi de probabilité d’une variable aléatoire permet d’obtenir des informations, voire des quasi certitudes, à partir d’observations aléatoires. Contexte La situation de référence est celle de l’étude d’une population dans laquelle on s’intéresse à un caractère de probabilité p, supposée connue. Le tirage au sort dans une population d’un individu qui peut présenter un caractère C avec une probabilité p est une épreuve de Bernoulli de paramètre p, où le succès est l’issue : « avoir le caractère C » Définition Un échantillon de taille n est une liste de n résultats obtenus par la répétition de n épreuves de Bernoulli indépendantes et identiques. Remarque : Le prélèvement au hasard d'un échantillon de taille n dans cette population s'assimile à un schéma de Bernoulli. Définition Un intervalle de fluctuation au seuil α est l’intervalle centrée autour de la valeur exactes de la proportion p du caractère dans la population, où se situe, avec une probabilité égale à α, la fréquence observée (avec 0 < α < 1). Remarque : Les distributions de fréquence varient d’un échantillon à l’autre (plus la taille des échantillons sera petite, plus les écarts pourront être grands), ce phénomène est appelé fluctuation d’échantillonnage Intérêt : Dans la pratique, on se servira des intervalles de fluctuation à un seuil donnée (souvent 0.95) pour rejeter ou non une hypothèse sur une proportion. II) Intervalles de fluctuation a) En classe de 𝟐𝒅𝒆 Définition Soit un échantillon de grande taille (n≥25), et p la probabilité de l’épreuve de Bernoulli (0,2≤ p ≤0,8) alors on appelle intervalle de fluctuation au seuil 95% l’intervalle I = [𝑝 − 1 √𝑛 ; 𝑝+ 1 √𝑛 ] Remarque : Cela signifie que pour environ 95% des échantillons de taille n, la fréquence observée de succès f, appartiendra à l’intervalle I. b) En classe de 𝟏𝒆𝒓 Soit 𝑋𝑛 la variable aléatoire, qui compte le nombre de succès (au sens de l’épreuve de Bernoulli), 𝑋𝑛 suit donc une loi Binomiale B(n,p). 𝑋 On lui associera F = 𝑛𝑛 , la variable aléatoire qui prend en compte la fréquence de succès Définition L’intervalle de fluctuation au seuil 95%, associé à une variable aléatoire X suivant une loi 𝑎 𝑏 𝑛 𝑛 binomiale de paramètre n et p, est l’intervalle I = [ ; ], où a et b sont définis par : - a est le plus petit des entiers k vérifiant P(𝑋𝑛 ≤k) > 0,025 - b est le plus petit des entiers k vérifiant P(𝑋𝑛 ≤k) ≥ 0,975 Cas général L’intervalle de fluctuation au seuil α associé à une variable aléatoire 𝑋𝑛 suivant une loi 𝑎 𝑏 𝑛 𝑛 binomiale de paramètre n et p, est l’intervalle I = [ ; ], où a et b sont définis par : - a est le plus petit des entiers k vérifiant P(𝑋𝑛 ≤k) > 1−𝛼 2 - b est le plus petit des entiers k vérifiant P(𝑋𝑛 ≤k) ≥ 1 − 1−𝛼 2 Remarque : Les déterminations de a et b seront réalisées en utilisant les ressources d’un outil de calcul électronique (ex) Excel). c) En classe de 𝑻𝒆𝒓 Théorème Soit X la variable aléatoire qui suit la loi Normale centrée réduite. Il existe un unique réel 𝑢𝛼 tel que P (-𝑢𝛼 < X <𝑢𝛼 ) = 1 – α Théorème Soit 𝑋𝑛 une variable aléatoire qui suit une loi Binomiale de paramètre n et p. L’intervalle de fluctuation asymptotique au seuil 1-α est l’intervalle : 𝐼𝑛 = [p − uα √𝑝(1−𝑝) √𝑛 ; p + uα 𝑋𝑛 Conséquence : L’intervalle 𝐼𝑛 contient la fréquence 𝐹𝑛 = 𝑛 √𝑝(1−𝑝) √𝑛 ] avec une probabilité qui se rapproche de 1-α lorsque n augmente. Remarque : conditions = n≥30, np≥5, n(1-p)≥5 Cas particulier: L’intervalle de fluctuation asymptotique au seuil de 95% est de la forme : 𝐼𝑛 = [ p − 1,96 √𝑝(1−𝑝) √𝑛 ; p + 1,96 √𝑝(1−𝑝) √𝑛 ] III) Utiliser un intervalle de fluctuation a) Prise de décision Propriété Connaissant le paramètre p d’une épreuve de Bernoulli, l’intervalle de fluctuation I permet d’étudier un échantillon donné afin de confirmer ou de rejeter une hypothèse autour de la valeur de p. Si la fréquence de succès observée f est en dehors de l’intervalle, on « rejette » l’hypothèse avec une erreur au seuil de 5%. Remarque : Ces résultats signifient que, dans 5% environ des cas, la décision prise (rejet ou validation) risque d’être incorrecte. b) Comparaison Soit l’intervalle de fluctuation au seuil de 95% 𝐼𝑛 = [𝑝 − définit en 𝟐𝒅𝒆 et J𝑛 = [p − 1,96 √𝑝(1−𝑝) √𝑛 ; p + 1,96 1 ; 𝑝+ √𝑛 √𝑝(1−𝑝) √𝑛 1 √𝑛 ] tel qui l’est ] l’intervalle ainsi définit en 𝑻𝒆𝒓 . Lequel nous offre le plus de précision ? 1 1 1 4 2 2 comme p ϵ [0 ; 1] alors p(1-p) ≤ donc √p(1 − p) ≤ et × 1,96 < 1 Ainsi J𝑛 C 𝐼𝑛 , l’intervalle définit en 𝑻𝒆𝒓 nous offre donc plus de précisions. IV) Exercices EXERCICE 1 En 2007, parmi les 557 députés élus à l’Assemblée Nationale, les femmes élus représentent 18, 5% des députés. La répartition hommes-femmes au sein de la population est 51, 6% de femmes et 48, 6% d’hommes. La parité homme/femme est-elle respectée en politique ? Monsieur Z, chef d’un gouvernement d’un pays lointain, affirme que 52% des électeurs lui font confiance. On réalise un sondage dans cette population en interrogeant 100 électeurs au hasard (la population est suffisamment grande pour considérer qu’il s’agit de tirages avec remise). EXERCICE 2 1) On fait l’hypothèse que Monsieur Z dit vrai et que la proportion des électeurs qui lui font confiance dans la population est p = 0,52. Montrer que la variable aléatoire X, correspondant au nombre d’électeurs lui faisant confiance dans un échantillon de 100 électeurs, suit la loi binomiale de paramètres n = 100 et p=0,52. 2) 3) A l’aide d’un tableur, donner la loi de probabilité de X et sa représentation graphique. Sur les 100 électeurs interrogés au hasard, 41 déclarent avoir confiance en Monsieur Z. Doit-on émettre un doute sur le pourcentage de 52% prononcé par Monsieur Z ? EXERCICE 3 Dans un casino, on a observé que sur 4040 lancers de dé, 2103 ont donné un nombre pair. Le casino utilise-t-il des dés truqués ? EXERCICE 4 Combien faut-il faire d’épreuves de « pile ou face » pour avoir une probabilité au moins de 0,95 que la proportion des piles soit comprise entre 0,47 et 0,53. EXERCICE 5 Proposer un algorithme qui nous donne l’intervalle de fluctuation tel qu’il est défini en 1er. ouverture : Estimation