Statistiques

publicité
Leçon 12 – Intervalle de Fluctuation
Pré requis :
- Epreuve et schéma de Bernoulli
- Loi Binomiale
- Loi Normale et théorème Moivre – Laplace
I)
Généralités et fluctuation d’échantillonnage
L’étude de la loi de probabilité d’une variable aléatoire permet d’obtenir des informations, voire des quasi
certitudes, à partir d’observations aléatoires.
Contexte La situation de référence est celle de l’étude d’une population dans laquelle on s’intéresse à un
caractère de probabilité p, supposée connue.
Le tirage au sort dans une population d’un individu qui peut présenter un caractère C avec une probabilité
p est une épreuve de Bernoulli de paramètre p, où le succès est l’issue : « avoir le caractère C »
Définition
Un échantillon de taille n est une liste de n résultats obtenus par la répétition de n épreuves
de Bernoulli indépendantes et identiques.
Remarque : Le prélèvement au hasard d'un échantillon de taille n dans cette population
s'assimile à un schéma de Bernoulli.
Définition
Un intervalle de fluctuation au seuil α est l’intervalle centrée autour de la valeur exactes de la proportion p
du caractère dans la population, où se situe, avec une probabilité égale à α, la fréquence observée (avec 0
< α < 1).
Remarque : Les distributions de fréquence varient d’un échantillon à l’autre (plus la taille des
échantillons sera petite, plus les écarts pourront être grands), ce phénomène est appelé
fluctuation d’échantillonnage
Intérêt : Dans la pratique, on se servira des intervalles de fluctuation à un seuil donnée (souvent 0.95) pour
rejeter ou non une hypothèse sur une proportion.
II)
Intervalles de fluctuation
a) En classe de 𝟐𝒅𝒆
Définition
Soit un échantillon de grande taille (n≥25), et p la probabilité de l’épreuve de Bernoulli
(0,2≤ p ≤0,8) alors on appelle intervalle de fluctuation au seuil 95% l’intervalle I =
[𝑝 −
1
√𝑛
; 𝑝+
1
√𝑛
]
Remarque : Cela signifie que pour environ 95% des échantillons de taille n, la fréquence
observée de succès f, appartiendra à l’intervalle I.
b) En classe de 𝟏𝒆𝒓
Soit 𝑋𝑛 la variable aléatoire, qui compte le nombre de succès (au sens de l’épreuve de Bernoulli), 𝑋𝑛 suit
donc une loi Binomiale B(n,p).
𝑋
On lui associera F = 𝑛𝑛 , la variable aléatoire qui prend en compte la fréquence de succès
Définition
L’intervalle de fluctuation au seuil 95%, associé à une variable aléatoire X suivant une loi
𝑎
𝑏
𝑛
𝑛
binomiale de paramètre n et p, est l’intervalle I = [ ; ], où a et b sont définis par :
- a est le plus petit des entiers k vérifiant P(𝑋𝑛 ≤k) > 0,025
- b est le plus petit des entiers k vérifiant P(𝑋𝑛 ≤k) ≥ 0,975
Cas général
L’intervalle de fluctuation au seuil α associé à une variable aléatoire 𝑋𝑛 suivant une loi
𝑎
𝑏
𝑛
𝑛
binomiale de paramètre n et p, est l’intervalle I = [ ; ], où a et b sont définis par :
- a est le plus petit des entiers k vérifiant P(𝑋𝑛 ≤k) >
1−𝛼
2
- b est le plus petit des entiers k vérifiant P(𝑋𝑛 ≤k) ≥ 1 −
1−𝛼
2
Remarque : Les déterminations de a et b seront réalisées en utilisant les ressources d’un
outil de calcul électronique (ex) Excel).
c) En classe de 𝑻𝒆𝒓
Théorème
Soit X la variable aléatoire qui suit la loi Normale centrée réduite.
Il existe un unique réel 𝑢𝛼 tel que P (-𝑢𝛼 < X <𝑢𝛼 ) = 1 – α
Théorème
Soit 𝑋𝑛 une variable aléatoire qui suit une loi Binomiale de paramètre n et p.
L’intervalle de fluctuation asymptotique au seuil 1-α est l’intervalle :
𝐼𝑛 = [p
− uα
√𝑝(1−𝑝)
√𝑛
; p + uα
𝑋𝑛
Conséquence : L’intervalle 𝐼𝑛 contient la fréquence 𝐹𝑛 =
𝑛
√𝑝(1−𝑝)
√𝑛
]
avec une probabilité qui se
rapproche de 1-α lorsque n augmente.
Remarque : conditions = n≥30, np≥5, n(1-p)≥5
Cas particulier: L’intervalle de fluctuation asymptotique au seuil de 95% est de la forme :
𝐼𝑛 = [ p
− 1,96
√𝑝(1−𝑝)
√𝑛
; p + 1,96
√𝑝(1−𝑝)
√𝑛
]
III) Utiliser un intervalle de fluctuation
a) Prise de décision
Propriété
Connaissant le paramètre p d’une épreuve de Bernoulli, l’intervalle de fluctuation I permet
d’étudier un échantillon donné afin de confirmer ou de rejeter une hypothèse autour de la
valeur de p.
Si la fréquence de succès observée f est en dehors de l’intervalle, on « rejette » l’hypothèse
avec une erreur au seuil de 5%.
Remarque : Ces résultats signifient que, dans 5% environ des cas, la décision prise (rejet ou
validation) risque d’être incorrecte.
b) Comparaison
Soit l’intervalle de fluctuation au seuil de 95% 𝐼𝑛 = [𝑝 −
définit en 𝟐𝒅𝒆 et J𝑛 = [p − 1,96
√𝑝(1−𝑝)
√𝑛
; p + 1,96
1
; 𝑝+
√𝑛
√𝑝(1−𝑝)
√𝑛
1
√𝑛
] tel qui l’est
] l’intervalle ainsi
définit en 𝑻𝒆𝒓 .
Lequel nous offre le plus de précision ?
1
1
1
4
2
2
comme p ϵ [0 ; 1] alors p(1-p) ≤ donc √p(1 − p) ≤ et
× 1,96 < 1
Ainsi J𝑛 C 𝐼𝑛 , l’intervalle définit en 𝑻𝒆𝒓 nous offre donc plus de précisions.
IV) Exercices
EXERCICE 1 En 2007, parmi les 557 députés élus à l’Assemblée Nationale, les femmes élus
représentent 18, 5% des députés.
La répartition hommes-femmes au sein de la population est 51, 6% de femmes et 48, 6%
d’hommes.
La parité homme/femme est-elle respectée en politique ?
Monsieur Z, chef d’un gouvernement d’un pays lointain, affirme que 52% des électeurs lui
font confiance. On réalise un sondage dans cette population en interrogeant 100 électeurs au hasard (la
population est suffisamment grande pour considérer qu’il s’agit de tirages avec remise).
EXERCICE 2
1)
On fait l’hypothèse que Monsieur Z dit vrai et que la proportion des électeurs qui lui font confiance
dans la population est p = 0,52.
Montrer que la variable aléatoire X, correspondant au nombre d’électeurs lui faisant confiance dans un
échantillon de 100 électeurs, suit la loi binomiale de paramètres n = 100 et p=0,52.
2)
3)
A l’aide d’un tableur, donner la loi de probabilité de X et sa représentation graphique.
Sur les 100 électeurs interrogés au hasard, 41 déclarent avoir confiance en Monsieur Z.
Doit-on émettre un doute sur le pourcentage de 52% prononcé par Monsieur Z ?
EXERCICE 3 Dans un casino, on a observé que sur 4040 lancers de dé, 2103 ont donné un
nombre pair.
Le casino utilise-t-il des dés truqués ?
EXERCICE 4 Combien faut-il faire d’épreuves de « pile ou face » pour avoir une probabilité au moins de
0,95 que la proportion des piles soit comprise entre 0,47 et 0,53.
EXERCICE 5 Proposer un algorithme qui nous donne l’intervalle de fluctuation tel qu’il est défini en 1er.
 ouverture : Estimation
Téléchargement