Le dixseptième chapitre, estimation et échantillonage, à

publicité
Chapitre 17
Estimations et échantillonnages.
I Intervalle de fluctuation asymptotique.
1 L’intervalle de fluctuation pour une variable aléatoire qui suit une loi binomiale.
X est une variable aléatoire qui suit la loi binomiale B(n; p).
On note F la suite définie sur les entiers 0, 1, · · · , n, par F (K) = P (X 6 K). Dans votre calculatrice cette fonction F
est dans l’écran des distributions, DISTR , B :binomFRép.
Utilisons le programme ci-dessous :
Algorithme :
Entrée : On demande le nombre d’essais N et la probabilité d’un succès P.
Initialisation : la variable K prend la valeur 0
Traitement 1 :
Tant Que F (K) < 0, 025
la variable K prend la valeur K+1
Fin du Tant Que
Affichage 1 : on affiche K
Traitement 2 :
Tant Que F (K) 6 0, 975
la variable K prend la valeur K+1
Fin du Tant Que
Affichage 2 : on affiche K
Programme pour Texas Instrument
Input "NB ESSAIS : ",N
Input "PROBA SUCCES : ",P
0 →K
While binomFRép(N,P,K) < 0.025
K+1 →K
End
Disp "A=",K
While binomFRép(N,P,K) 60.975
K+1 →K
End
Disp "B=",K
Que réalise ce programme, cet algorithme ? Vous pouvez l’utiliser avec la variable aléatoire X qui suit la loi B(100; 0, 6).
Ainsi, les nombres A et B affichés vérifient :
177
CHAPITRE 17. ESTIMATIONS ET ÉCHANTILLONNAGES.
178
w P (X < A) < 0, 025 et P (X 6 A) > 0, 025.
soit ici
w P (X < · · · ) < 0, 025 et P (X 6 · · · ) > 0, 025.
w P (X 6 B) 6 0, 975 et P (X > B) > 0, 975.
w P (X 6 · · · ) 6 0, 975 et P (X > · · · ) > 0, 975.
w Ainsi P (A 6 X 6 B) > 0, 95.
w Ainsi P (· · · · · · 6 X 6 · · · · · · ) > 0, 95.
X
X
, donc, avec l’exemple précédent, F =
. Cette variable aléatoire
n
100
représente les fréquences de la variable aléatoire X. Avec les notation précédentes :
On définit la variable aléatoire F par F =
A 6X6
A
X
6
6
n
n
Ainsi, P
B
A
6F 6
n
n
B
B
n
A B
> 0, 95. On peut aussi écrire en utilisant un intervalle P F ∈
;
> 0, 95.
n n
Définition Cet intervalle est l’intervalle de fluctuation de F au seuil de 95%.
Donner l’intervalle de fluctuation obtenue avec le programme précédent :
⋆ Remarque Si on définit une suite de variables aléatoires Xn où n est un entier naturel strictement positif, Xn
suivant la loi binomiale B(n; p), on obtient ainsi une suite d’intervalles au seuil de 95%. Le problème ici, c’est que
nous n’avons aucune formule explicite qui permette de déterminer cette suite d’intervalles.
2 Avec le théorème de Moivre-Laplace.
On rappelle ce théorème :
♣ Théorème p est un nombre réel de l’intervalle ]0; 1[. Z est une variable aléatoire qui suit la loi normale N (0; 1).
6 On définit une suite de variables aléatoires Xn où n est un entier naturel strictement positif. Quel que soit le nombre
entier naturel n > 1, Xn suit la loi binomiale B(n;
p p).
6 Pour tout entier naturel n, µ = Xn = np et σ = np(1 − p).
Xn − np
6 Pour tout entier n > 1, on note Zn la variable centrée réduite associée à la variable aléatoire Xn , Zn = p
.
np(1 − p)
Alors, quels que soient les nombres réels a et b (a < b),
lim P (a < Zn < b) = P (a < Z < b) =
n→+∞
Z
a
b
1
x2
√ e− 2 dx
2π
I. INTERVALLE DE FLUCTUATION ASYMPTOTIQUE.
179
On peut réécrire ce théorème en introduisant la suite de variables aléatoires (Fn ) définie pour tout entier n > 1 par
Xn
, pour un encadrement du type −u < Zn < u. On a alors :
Fn =
n
w On note alors que :
!
Xn − np
P (−u < Zn < u) = P −u < p
<u
np(1 − p)
p
p
P (−u < Zn < u) = P −u np(1 − p) < Xn − np < u np(1 − p)
p
p
P (−u < Zn < u) = P np − u np(1 − p) < Xn < np + u np(1 − p)
!
p
p
np(1 − p)
np(1 − p)
< Fn < p + u
P (−u < Zn < u) = P p − u
n
n
!
p
p
p(1 − p)
p(1 − p)
√
√
< Fn < p + u
P (−u < Zn < u) = P p − u
n
n
w En écrivant ces inégalités sous forme d’intervalle, on obtient :
"
#!
p
p
p(1 − p)
p(1 − p)
√
√
P (Zn ∈ [−u; u]) = P Fn ∈ p − u
;p + u
n
n
w On peut alors appliquer le théorème de Moivre-Laplace :
!
p
p
p(1 − p)
p(1 − p)
√
√
p−u
< Fn < p + u
= P (−u < Z < u)
n
n
lim P
n→+∞
Où bien, avec des intervalles :
"
#!
p
p
p(1 − p)
p(1 − p)
√
√
Fn ∈ p − u
;p + u
= P (Z ∈ [−u; u])
n
n
lim P
n→+∞
On rappelle que Z suit la loi normale N (0; 1).
♣ Théorème p est un nombre réel de l’intervalle ]0; 1[.Z est une variable aléatoire qui suit la loi normale N (0; 1).
6 On définit une suite de variables aléatoires Xn où n est un entier naturel strictement positif. Quel que soit le nombre
entier naturel n > 1, Xn suit la loi binomiale B(n; p).
Xn
6 La suite de variables aléatoires (Fn ) est définie pour tout entier n > 1 par Fn =
.
n
6 α est un nombre réel, 0"< α < 1. On note u l’unique réel qui
# vérifie P (−u 6 Z 6 u) = 1 − α.
p
p
p(1 − p)
p(1 − p)
√
√
6 On note In l’intervalle p − u
;p + u
.
n
n
Alors lim P (Fn ∈ In ) = P (−u < Z < u) = 1 − α.
n→+∞
Définition L’intervalle In =
"
#
p
p
p(1 − p)
p(1 − p)
√
√
p−u
;p + u
est l’intervalle de fluctuation asymptotique de
n
n
Xn
au seuil de 1 − α. C’est à dire que, Fn appartient à l’intervalle In avec une probabilité proche de 1 − α.
n
En utilisant le cours sur la loi normale N (0; 1) :
6 avec α = 0, 05, on a vu que u = 1, 96 ;
6 avec α = 0, 01, on a vu que u = 2, 58.
Fn =
On obtient deux intervalles de fluctuation asymptotiques de référence :
CHAPITRE 17. ESTIMATIONS ET ÉCHANTILLONNAGES.
180
6 In
de Fn
6 In
de Fn
"
#
p
p
p(1 − p)
p(1 − p)
√
√
= p − 1, 96
; p + 1, 96
est l’intervalle de fluctuation asymptotique
n
n
Xn
=
au seuil de 95% ;
n
"
#
p
p
p(1 − p)
p(1 − p)
√
√
= p − 2, 58
; p + 2, 58
est l’intervalle de fluctuation asymptotique
n
n
Xn
=
au seuil de 99%
n
On peut l’illustrer avec un tableur :
Exercice sur le livre : faire l’exercice n◦ 7 page 444.
3 L’intervalle de fluctuation vu en seconde.
⋆ Remarque On note que les bornes supérieures et inférieures des intervalles de fluctuation asymptotiques au seuil
p
de 95% dépendent de la fonction f : p 7−→ 1, 96 p(1 − p) où 0 < p < 1. On peut étudier cette fonction pour la
majorer.
I. INTERVALLE DE FLUCTUATION ASYMPTOTIQUE.
181
1.0
0.8
0.6
0.4
0.2
−0.2
0.2
0.4
0.6
0.8
1.0
−0.2
On peut voir sur la représentation graphique
p de f que le maximum est inférieur à 1. On fait une étude des variations
pour le prouver. On note que f (p) = 1, 96 p − p2 .
1 − 2p
f ′ (p) = 1, 96 p
. On voit que cette dérivée est du signe de 1 − 2p.
2 p − p2
Le tableau de variation de f est :
p
1
2
0
signe de f ′ (p)
+
✸
✑✑
f (p)
0
1
f
2
0
1
−
◗◗
s
0
r
1
1 1
1
Le maximum est f
= 1, 96
− = 1, 96 × = 0, 98.
2
2 4
2
p
1
1
Ainsi, pour tout p ∈]0; 1[, 1, 96 p(1 − p) < 1. L’intervalle Jn = p − √ ; p + √ contient l’intervalle In . L’intervalle
n
n
de fluctuation du cours de seconde est plus grand que celui de terminale, c’est pourquoi :
1
1
P Fn ∈ p − √ ; p + √
> 0, 95
n
n
4 En pratique.
6 Ces intervalles de fluctuation asymptotique peuvent être utilisés dès que n > 30, np > 5 et n(1 − p) > 5.
6 On les utilise aussi quand on veut estimer si une probabilité p0 est égale où pas à une valeur donnée connue
autrement p. Autrement dit, est ce que l’hypothèse p = p0 est vraie ou pas ?
La méthode de prise de décision au seuil de 95 % est la suivante :
CHAPITRE 17. ESTIMATIONS ET ÉCHANTILLONNAGES.
182
6 On vérifie que les conditions n > 30, np > 5 et n(1 − p) > 5 sont bien remplies.
"
#
p
p
p(1 − p)
p(1 − p)
√
√
6 On calcule l’intervalle de fluctuation In = p − 1, 96
; p + 1, 96
.
n
n
6 On calcule, si on ne l’a pas déjà fait la fréquence f observée.
"
#
p
p
p(1 − p)
p(1 − p)
√
√
6 Si f ∈ p − 1, 96
; p + 1, 96
, on accepte l’hypothèse que p0 = p, au seuil
n
n
de 95%
"
#
p
p
p(1 − p)
p(1 − p)
√
√
6f ∈
/ p − 1, 96
; p + 1, 96
, on rejette l’hypothèse que p0 = p. Ce faisant,
n
n
comme 5% des fréquences sont en dehors de l’intervalle, on a 5% de chance de se tromper.
Exercices sur le livre : faire les exercices n◦ 9, n◦ 10 et n◦ 13 page 445.
II Intervalle de confiance.
Un intervalle de confiance s’utilise quand on ne connait pas la probabilité p (ou ce qui revient au même, de la proportion p d’un caractère dans une population) mais qu’on veut l’estimer. On observe donc une fréquence f , sur un
échantillon de taille n, pour estimer une probabilité, une proportion. Il suffit pour cela de « retourner » l’inégalité
1
1
p− √ 6f 6p+ √ .
n
n
Première inégalité.
1
p− √
n
6
f
p
6
1
f+√
n
Seconde inégalité.
f
6
1
p+ √
n
1
f−√
n
6
p
1
1
1
1
On remarque que f − √ 6 p 6 f + √ , ou bien, en traduisant en intervalle, p ∈ f − √ ; f + √ . On a donc
n
n
n
n
démontré que :
1
1
1
1
f ∈ p − √ ;p + √
est équivalent à p ∈ f − √ ; f + √
n
n
n
n
Ainsi :
1
1
√
√
♣ Théorème Il existe un rang n0 à partir duquel P p ∈ f −
;f +
> 0, 95.
n
n
1
1
Définition L’intervalle f − √ ; f + √
est un intervalle de confiance à 95% de la probabilité (ou de la proporn
n
tion) p.
Exercices sur le livre : faire les exercices n◦ 16, n◦ 18 et n◦ 20 page 446.
Téléchargement