Estimation par intervalle de confiance

publicité
Statistiques
L2 Psychologie
Estimation par intervalle de confiance
On présente ici un rappel concernant le TD5 et le TD6.
Pour une étude plus détaillée il faut se reporter aux notes du cours magistral.
1
Statistiques
2.1
L2 Psychologie
Intervalle de confiance pour la moyenne d’une distribution
normale
Dans ce paragraphe on suppose que Xi ∼ N (µ ; σ 2 ).
1 ⋄ Si on connaît la variance σ 2 :
Introduction
σ
σ
x̄n − u1− α2 . √ ≤ µ ≤ x̄n + u1− α2 . √
n
n
L’estimation par intervalle de confiance consiste à proposer un intervalle dans lequel le
paramètre à estimer se trouvera avec une certaine probabilité.
Autrement dit, en notant X un estimateur de θ, un intervalle de confiance de θ au niveau
de confiance 1 − α est un intervalle [X − d ; X + d] tel que :
2 ⋄ Si on ne connait pas la variance σ 2 :
sn
sn
x̄n − t1− α2 . √ ≤ µ ≤ x̄n + t1− α2 . √
n
n
P (X − d ≤ θ ≤ X + d) = 1 − α
Si n est suffisemment grand (n ≥ 30) le résultat ci–dessus peut–être approximé par :
Si on prend α = 5%, l’intervalle de confiance de θ a un niveau de confiance de 95%.
Cela veut dire qu’en utilisant X comme estimateur du paramètre θ, en moyenne, sur 100
échantillons, 95 fois l’intervalle de confiance contiendra la vraie valeur du paramètre et 5
fois il ne la comprendra pas.
sn
sn
x̄n − u1− α2 . √ ≤ µ ≤ x̄n + u1− α2 . √
n
n
Nous rappelons dans la suite comment trouver un intervalle de confiance quand le paramètre à estimer est une moyenne ou une proportion. Cette intervalle dépendra de la
forme de la loi de distribution de l’estimateur X, de la taille de l’échantillon et de la
connaissance ou de l’ignorance de la variance de la population.
2
Intervalle de confiance pour une moyenne
On utilisera les notations suivantes :
Pour i = 1, . . . , n, les Xi sont des variables aléatoires indépendantes et toutes de même
loi.
µ et σ 2 représentent la moyenne et la variance des variables Xi .
x1 + · · · + xn
x̄n est la moyenne empirique des xi : x̄n =
.
n
s2n est la variance corrigée des xi : s2n =
(x1 − x̄n )2 + · · · + (xn − x̄n )2
n−1
⋄ Exemple : Douze adultes francophones ont fait l’objet d’une expérience de mémoire. Le
temps (en minutes) pour apprendre une liste de 5 verbes allemands est donné ci–dessous :
5,1 4,8
6,3 5,0 5,5 5,0
5,2 4,9 4,5 5,8
5,3 5,2
On suppose que le temps d’apprentissage de ces 5 verbes suit une distribution normale et
on cherche un intervalle de confiance pour le temps moyen d’apprentissage à un niveau
de confiance de 95%.
On est donc dans le cas où la distribution est normale, la variance est inconnue et n est
petit (n = 12).
En utilisant les mêmes notations que précédemment on a : 1 − α = 0, 95 et donc α = 0, 05,
x̄n =
5, 1 + 4, 8 + · · · + 5, 3 + 5, 2
≃ 5, 22
12
s2n =
(5, 1 − 5, 22)2 + (4, 8 − 5, 22)2 + · · · + (5, 2 − 5, 22)2
≃ 0, 23 et donc sn ≃ 0, 48.
12 − 1
t1− α2 = t0,975 = 2, 201 (on a n − 1 = 12 − 1 = 11 degrés de liberté).
On a :
u1− α2 est le fractile de 1 − α2 qui sera lu dans la table des fractiles de la loi normale centrée
réduite.
0, 48
0, 48
5, 22 − 2, 201. √ ≤ µ ≤ 5, 22 + 2, 201. √
12
12
et donc :
t1− α2 est le fractile de 1 −
n − 1 degrés de liberté.
α
2
qui sera lu dans la table des fractiles de la loi de Student à
4, 92 ≤ µ ≤ 5, 52
Le temps d’apprentissage moyen des 5 verbes est donc compris entre 4,92 minutes et 5,52
minutes avec une probabilité de 95%.
1
2
Statistiques
2.2
L2 Psychologie
Intervalle de confiance pour la moyenne d’une distribution
quelconque
Dans ce paragraphe la distribution des Xi n’est pas forcemment normale.
1 ⋄ Si n est grand (n ≥ 30) :
(a) Si la variance σ 2 est connue :
σ
σ
x̄n − u1− α2 . √ ≤ µ ≤ x̄n + u1− α2 . √
n
n
Statistiques
2 ⋄ Si n n’est pas grand (n < 30) : il est plus difficile de construire un intervalle de
confiance.
⋄ Exemple : Un échantillon aléatoire de 100 gravures, pris au hasard dans un grand lot,
en contient 15 ayant certaines imperfections.
On veut déterminer un intervalle de confiance de la proportion des gravures défectueuses
de ce lot à un niveau de 95%.
15
En utilisant les notations précédentes, on a : n = 100 ; f =
= 0, 15 ; 1 − α = 0, 95
100
donc α = 0, 05 et u1− α2 = u0,975 = 1, 96. Donc :
r
(b) Si la variance σ 2 n’est pas connue :
sn
sn
x̄n − u1− α2 . √ ≤ µ ≤ x̄n + u1− α2 . √
n
n
2 ⋄ Si n n’est pas grand (n < 30) : il est difficile de construire un intervalle de confiance.
⋄ Exemple : Un fabricant de voitures teste la consommation d’essence sur 80 véhicules
d’un même type. Il trouve que la consommation moyenne est x̄ = 6 litres au cent. De
plus, il sait que l’écart–type de la consommation pour ce type de voiture est σ = 0, 2 litre
au cent.
On cherche l’intervalle de confiance de l’estimation de la consommation moyenne µ des
voitures à un niveau de confiance de 95%.
On est ici dans le cas où l’on ne connaît pas la loi des Xi , la variance est connue et n est
grand (n = 80).
On a α = 0, 05 ; x̄ = 6 et σ = 0, 2. De plus, u1− α2 = u0,975 = 1, 96. Donc,
L2 Psychologie
0, 15 − 1, 96.
r
0, 15 × (1 − 0, 15)
0, 15 × (1 − 0, 15)
≤ p ≤ 0, 15 + 1, 96.
100
100
Donc :
0, 08 ≤ p ≤ 0, 22
Il y a donc 95% de chance qu’il y ait entre 8% et 22% de gravures avec des imperfections
dans le grand lot.
0, 2
0, 2
6 − 1, 96. √ ≤ µ ≤ 6 + 1, 96. √
80
80
On trouve :
5, 95 ≤ µ ≤ 6, 04
La consommation moyenne µ est donc comprise entre 5,95 et 6,04 litres au cent avec une
probabilité de 95%.
3
Intervalle de confiance pour une proportion
On utilisera les notations suivantes :
p est la proportion d’individus d’une population possédant un certain caractère A (p est
la proportion à estimer).
f est une estimation ponctuelle de p.
1 ⋄ Si n est grand (n ≥ 30) :
r
f − u1− α2 .
r
f × (1 − f )
f × (1 − f )
≤ π ≤ f + u1− α2 .
n
n
3
4
Téléchargement