P X n

publicité
Intervalle de fluctuation – Intervalle de confiance - Estimation d'une proportion
I Intervalles de fluctuation de la fréquence
1°) Rappels
Soit un échantillon contenant n individus ayant un caractère dont la proportion p (la probabilité) est connue.
On connaît déjà deux intervalles de fluctuation de la fréquence :
– un, étudié en seconde :
n25 et 0,2 p0,8 alors, la fréquence f d'un caractère appartient à l'intervalle
Si
[
p−
1
1
, p+
√n
√n
]
avec une
probabilité au moins égale à 95%, on dit au seuil de 95%
– un, étudié en première :
On considère la variable aléatoire X donnant le nombre de fois que le caractère observé est obtenu, X suit une loi binomiale de
paramètres n et p.
[ ]
a b
,
où :
n n
p  X ≤a 0,025
p  X ≤b≥0,975 .
L'intervalle de fluctuation de la fréquence f au seuil de 95% est
- a est la plus petite valeur de X pour laquelle
- b est la plus petite valeur de X pour laquelle
Il reste à en découvrir un autre appelé intervalle de fluctuation asymptotique.
2°) Intervalle de fluctuation asymptotique
On s'intéresse au caractère d'une population dont on connaît la probabilité p.
A chaque échantillon de la population de taille n la variable aléatoire X n qui donne le nombre d'individus qui vérifie ce
caractère suit une loi binomiale de paramètres n et p.
Xn
correspond à la variable aléatoire fréquence qui, à tout échantillon de taille n, associe la fréquence obtenue.
n
Propriété
Si la variable aléatoire
X n suit la loi binomiale B(n,p), alors, pour tout α∈ ] 0 , 1 [ on a :
Xn
√ p (1− p) , p+ u √ p (1− p)
p−uα
lim P
∈I n =1−α où I n désigne l'intervalle
α
n
n  ∞
√n
√n
u α étant l'unique réel tel que P (−uα ≤Z≤u α )=1−α , Z suit la loi normale N(0,1).

[

]
.
Démonstration :
–-------------------------------------------------------------------------------------------------------------------------------------------------------Définition
L'intervalle
de
fluctuation
asymptotique
de
la
fréquence
au
seuil
de
95%
est
[
p−1,96 
]
p 1− p 
p 1− p
, p1,96 
.
n
n
On peut faire cette approximation lorsque n≥30 , np≥5 et n 1− p≥5 .
Remarque : en majorant 1,96  p 1− p par 1 on obtient l'intervalle de fluctuation donné en seconde.
3°) Prise de décision aux conditions n≥30 , np≥5 et n (1− p)≥5
Tester un échantillon
Si la probabilité p d'obtention d'un caractère d'une population est connue on peut tester si un échantillon de taille n de la
population est représentatif de celle-ci concernant ce caractère.
On détermine la fréquence f du caractère étudié dans l'échantillon.
Si
[
f ∈ p−1,96 
p1− p
p 1− p 
, p1,96 
n
n
]
on peut considérer que l'échantillon est représentatif au seuil de 95%.
Tester une proportion
Si la proportion p d'obtention d'un caractère d'une population est estimée on peut rejeter ou non cette estimation.
On détermine la fréquence f du caractère étudié dans un échantillon de taille n de la population.
Si
[
f ∈ p−1,96 
p1− p
p 1− p 
, p1,96 
n
n
]
on peut accepter l'estimation de la proportion p au seuil de 95%.
II Intervalle de confiance de la proportion p - Estimation d'une proportion – Taille d'un échantillon
Propriété :
Si la variable aléatoire X n suit la loi binomiale B(n,p) et si F n est la variable aléatoire fréquence
assez grand l'intervalle
[
F n−
1
1
, F n+
√n
√n
]
Xn
alors pour n
n
contient la proportion p avec une probabilité au moins égale à 0,95.
Démonstration :
–-----------------------------------------------------------------------------------------------------------------------------Définition d'un intervalle de confiance de la proportion au seuil de 95 %
On ne connaît pas la proportion p d'un caractère d'une population.
On connaît la fréquence f de ce caractère déterminée sur un échantillon de taille n.
On appelle intervalle de confiance de la proportion inconnue p avec un niveau de confiance de 95% l'intervalle
[
]
1
1
, f
. C'est-à-dire que
n
n
, np≥5 et n (1− p)≥5 .
f−
[
p∈ f −
1
1
, f
n
n
]
avec un niveau de confiance de 95% lorsque
n≥30
Utilisation :
Estimer une proportion p avec un niveau de confiance de 95% à partir d'une fréquence f déterminée sur un échantillon de taille
n.
En connaissant f et n on peut déterminer l'intervalle auquel appartient p avec un niveau de confiance de 95%.
[
p∈ f −
1
1
,f+
√n
√n
]
Déterminer la taille n d'un échantillon pour obtenir avec une précision donnée une estimation de la proportion d'un caractère
d'une population au niveau de confiance de 95%.
L'intervalle de confiance ayant une amplitude
confiance d'amplitude a on calcule n sachant que
1
1
2
– ( f − )=
√n
√n √n
4
2
≤a soit n≥ 2 .
a
√n
a= f +
, si on veut déterminer un intervalle de
Téléchargement