Intervalle de fluctuation – Intervalle de confiance - Estimation d'une proportion
I Intervalles de fluctuation de la fréquence
1°) Rappels
Soit un échantillon contenant n individus ayant un caractère dont la proportion p (la probabilité) est connue.
On connaît déjà deux intervalles de fluctuation de la fréquence :
un, étudié en seconde :
Si
n25
et
0,2p0,8
alors, la fréquence f d'un caractère appartient à l'intervalle
[
p1
n, p+1
n
]
avec une
probabilité au moins égale à 95%, on dit au seuil de 95%
un, étudié en première :
On considère la variable aléatoire X donnant le nombre de fois que le caractère observé est obtenu, X suit une loi binomiale de
paramètres n et p.
L'intervalle de fluctuation de la fréquence f au seuil de 95% est
[
a
n,b
n
]
où :
- a est la plus petite valeur de X pour laquelle
pXa0,025
- b est la plus petite valeur de X pour laquelle
pXb≥0,975
.
Il reste à en découvrir un autre appelé intervalle de fluctuation asymptotique.
2°) Intervalle de fluctuation asymptotique
On s'intéresse au caractère d'une population dont on connaît la probabilité p.
A chaque échantillon de la population de taille n la variable aléatoire
Xn
qui donne le nombre d'individus qui rifie ce
caractère suit une loi binomiale de paramètres n et p.
Xn
n
correspond à la variable aléatoire fréquence qui, à tout échantillon de taille n, associe la fréquence obtenue.
Propriété
Si la variable aléatoire
Xn
suit la loi binomiale B(n,p), alors, pour tout
on a :
lim
n
P
Xn
nIn
=1α
In
désigne l'intervalle
[
puα
p(1p)
n, p+uα
p(1p)
n
]
.
uα
étant l'unique réel tel que
P(uαZuα)=1α
, Z suit la loi normale N(0,1).
Démonstration :
–--------------------------------------------------------------------------------------------------------------------------------------------------------
Définition
L'intervalle de fluctuation asymptotique de la fréquence au seuil de 95% est
[
p1,96
p1p
n, p1,96
p1p
n
]
.
On peut faire cette approximation lorsque
n30
,
np5
et
n1p≥5
.
Remarque : en majorant
1,96
p1p
par 1 on obtient l'intervalle de fluctuation donné en seconde.
3°) Prise de décision aux conditions
n30
,
np5
et
n(1p)5
Tester un échantillon
Si la probabilité p d'obtention d'un caractère d'une population est connue on peut tester si un échantillon de taille n de la
population est représentatif de celle-ci concernant ce caractère.
On détermine la fréquence f du caractère étudié dans l'échantillon.
Si
f
[
p1,96
p1p
n, p1,96
p1p
n
]
on peut considérer que l'échantillon est représentatif au seuil de 95%.
Tester une proportion
Si la proportion p d'obtention d'un caractère d'une population est estimée on peut rejeter ou non cette estimation.
On détermine la fréquence f du caractère étudié dans un échantillon de taille n de la population.
Si
f
[
p1,96
p1p
n, p1,96
p1p
n
]
on peut accepter l'estimation de la proportion p au seuil de 95%.
II Intervalle de confiance de la proportion p - Estimation d'une proportion – Taille d'un échantillon
Propriété :
Si la variable aléatoire
Xn
suit la loi binomiale B(n,p) et si
Fn
est la variable aléatoire fréquence
Xn
n
alors pour n
assez grand l'intervalle
[
Fn1
n, F n+1
n
]
contient la proportion p avec une probabilité au moins égale à 0,95.
Démonstration :
–------------------------------------------------------------------------------------------------------------------------------
Définition d'un intervalle de confiance de la proportion au seuil de 95 %
On ne connaît pas la proportion p d'un caractère d'une population.
On connaît la fréquence f de ce caractère déterminée sur un échantillon de taille n.
On appelle intervalle de confiance de la proportion inconnue p avec un niveau de confiance de 95% l'intervalle
[
f1
n, f 1
n
]
. C'est-à-dire que
p
[
f1
n, f 1
n
]
avec un niveau de confiance de 95% lorsque
n30
,
np5
et
n(1p)5
.
Utilisation :
Estimer une proportion p avec un niveau de confiance de 95% à partir d'une fréquence f terminée sur un échantillon de taille
n .
En connaissant f et n on peut déterminer l'intervalle auquel appartient p avec un niveau de confiance de 95%.
p
[
f1
n, f +1
n
]
Déterminer la taille n d'un échantillon pour obtenir avec une précision donnée une estimation de la proportion d'un caractère
d'une population au niveau de confiance de 95%.
L'intervalle de confiance ayant une amplitude
a=f+1
n(f1
n)= 2
n
, si on veut déterminer un intervalle de
confiance d'amplitude a on calcule n sachant que
2
na
soit
n4
a2
.
1 / 2 100%