X - Open-CIM

publicité
Introduction
À l’estimation
Estimation
Moyenne
Estimation
Proportion
Introduction à l’estimation
 Estimation d’une moyenne
 Estimation d’une proportion
Estimation
fréquence
Echantillonnage
fréquence
1 / 15
Introduction
À l’estimation
Estimation
Moyenne
Exemple de problème
 Population = étudiants Sup de Co
 Un besoin :
Estimation
Proportion
Je voudrais connaître le nombre d’heures
de travail par semaine
pour un étudiant Sup de Co.
Estimation
fréquence
Echantillonnage
fréquence
2 / 15
Introduction
À l’estimation
Estimation à partir d’un échantillon
Population
Taille : N
Estimation
Moyenne
(Sup de Co)
x
x
Estimation
Proportion
x
x
Estimation
x
x
x
Estimation
fréquence
Echantillonnage
fréquence
une variable quantitative X = nb d’heures de
travail par semaine
On voudrait
x
x
x
connaître un
m
=
la
x
x
paramètre de la
x
moyenne
des
population
x
valeursxde X
x
x la x
dans
x
x
population
x
x
x
x
Echantillon
taille : n
x
x
On peut
m = moyenne
des
calculer une
x xx
x
valeurs
x de X
statistique à
x
x
x
x
dans
l‘échantillon
x
partir de
x
x
x
x
l’échantillon
x
Supposons
x que l’on
x trouve
x m = 10. On peut estimer m
x
x
 par 10 (estimation ponctuelle)
 ou par une « fourchette » autour de 10
(estimation par intervalle de confiance)
3 / 15
Introduction
À l’estimation
Estimation
Moyenne
Estimation
Proportion
Distribution d’échantillonnage d’une moyenne
Si n est
suffisamment
grand,
on peut
considérer que la
distribution de m
est normale
mmm
mmmm
mmmmm
mmmmmm
mmmmmmm
mmmmmmm
mmmmmmmm
mmmmmmmm
mmmmmmmm
et d’écart-type sm
s
sm 
mmmmmmmmm
n
mmmmmmmmmm
mmmmmmmmmmm
C=
mmmmmmmmmmmmm
mmmmmmmmmmmmmmmm
mmmmmmmmmmmmmmmmmmm
de moyenne m
Estimation
fréquence
Echantillonnage
fréquence
95 % des m
m - 1,96 sm
m
C
(N - n)
(N - 1)
m + 1,96 sm
4 / 15
Introduction
À l’estimation
Estimation d’une moyenne
mm
m
mm
Cas
mm
mmmm
mmmm
mmmm
mmmmm
mmmmm
mmmmm
mmmmmm
mmmmmm
mmmmmmm
mmmmmmmmm
mmmmmmmmmm
mmmmmmmmmmmm
Estimation
Moyenne
Estimation
Proportion
m - 1,96 sm
Estimation
fréquence
Echantillonnage
fréquence
m
s
n
 C , m + 1,96
95 % des m
m + 1,96 sm
Intervalle de confiance à 95% pour m
[ m - 1,96
simple : s connu
s
n
C]
Intervalle de confiance à x% pour m
[ m- Z
s
n
C , m +Z
s
n
C]
5 / 15
Introduction
À l’estimation
Estimation d’une moyenne
Cas général : s inconnu
Estimation
Moyenne
Estimation
Proportion
Estimation
fréquence
Echantillonnage
fréquence
Intervalle de confiance
à x % pour m
s
s
[ m- Z
C,m +Z
C]
n
n
(x i - m) 2
Un bon estimateur pour s est s  
n -1
i 1
n
m  t
s
C
n
t suit une loi de Student à n-1 degrés de liberté
6 / 15
Introduction
À l’estimation
La loi de Student
“famille de courbes” avec un nombre de degrés de liberté
(ddl) qui varie.
Estimation
Moyenne
ddl = 25
ddl = 10
Estimation
Proportion
0
Estimation
fréquence
Echantillonnage
fréquence
t
• Nb ddl = n-1
• t a une courbe de forme similaire à la loi
normale (Z)
• Quand n (ou le nb de ddl) augmente, on se
rapproche de la courbe normale.
7 / 15
Introduction
À l’estimation
Estimation
Moyenne
Estimation
Proportion
Estimation
fréquence
Echantillonnage
fréquence
La loi de Student avec Excel
1-
a/2
a
- ta/2
a/2
+ ta/2
Z
(1- a) = niveau de confiance
a = erreur
8 / 15
Introduction
À l’estimation
Student : exemple de lecture directe
20 ddl
Estimation
Moyenne
Estimation
Proportion
Estimation
fréquence
Echantillonnage
fréquence
+1
LOI.STUDENT(1;20;1) = 0,1646
Lecture unilatérale ou bilatérale
9 / 15
Introduction
À l’estimation
Student : exemple de lecture inverse
Estimation
Moyenne
95%
2,5%
Estimation
Proportion
Estimation
fréquence
Echantillonnage
fréquence
- ta/2
2,5%
+ ta/2
=LOI.STUDENT.INVERSE(0,05;20)
=2,086
Lecture forcément bilatérale
10 / 15
Introduction
À l’estimation
Estimation d’une moyenne: exemple
 N = 1500, n =100, m =10, s = 5
Estimation
Moyenne
 L’écart-type de la population est inconnu, donc pour estimer
m, il faut
utiliser la formule:
m  t
Estimation
Proportion
s
C
n
 Calculons un intervalle de confiance à 95% pour
m.
 Le nombre de ddl est 100-1 = 99
Estimation
fréquence
Echantillonnage
fréquence
 t vaut donc 1,9842 (fonction Excel: LOI.STUDENT.INVERSE(0,05;99))
Remarque t est proche de 1,96 – Avec un échantillon de taille 100, nous
aurions pu utiliser l’approximation normale.
 Le terme correcteur C vaut: 0,9835 (proche de 1)
 On trouve l’intervalle
[ 9,02 ; 10,98 ]
11 / 15
Et pour une proportion, c’est pareil...
Introduction
À l’estimation
une variable qualitative «FUMEUR»
Population
Taille : N
Estimation
Moyenne
Estimation
Proportion
x
(Sup de Co)
x
x
x
x
x
x
x
x
x
x
Estimation
x
x
x
x
x
Estimation
fréquence
Echantillonnage
fréquence
x
x
p =xla
proportion
x
des
x fumeurs
x
dans la
population
x
x
pe = proportion
x xx
x
x
x
x
des
x fumeurs x
x
x
x
x
x
x dans l‘échantillon
x
x
x
x x
x
x
On voudrait
connaître un
paramètre de la
population
On peut
calculer une
statistique à
partir de
l’échantillon
Echantillon
taille : n
12 / 15
Introduction
À l’estimation
Distribution d’échantillonnage d’une proportion
Si n est suffisamment grand,
Estimation
Moyenne
on peut considérer que la distribution de pe
– est normale
Estimation
Proportion
Estimation
fréquence
Echantillonnage
fréquence
– a pour moyenne
E(pe)=p
– et pour écart-type
sp
e
C =

p (1- p )
xC
n
(N - n)
(N - 1)
13 / 15
Introduction
À l’estimation
Estimation
Moyenne
Estimation d’une proportion
On se limite aux grands échantillons
Estimation
Proportion
Intervalle de confiance à x % pour p
Estimation
fréquence
Echantillonnage
fréquence
pe(1 - pe)
pe(1 - pe)
[ pe - Z
 C , pe + Z
C]
n
n
14 / 15
Introduction
À l’estimation
Estimation d’une proportion: exemple
 N = 1500, n =100, pe =0,28 (proportion de fumeurs dans
l’échantillon de 100 personnes)
Estimation
Moyenne
Estimation
Proportion
 On utilise la formule:
[ pe - Z
pe(1 - pe)
pe(1 - pe)
 C , pe + Z
C]
n
n
 Calculons un intervalle de confiance à 95% pour p (la proportion de fumeurs
dans la population Sup de Co).
Estimation
fréquence
Echantillonnage
fréquence
 Z vaut 1,96 (fonction Excel: LOI.NORMALE.STANDARD.INVERSE(0,975)
 Le terme correcteur C vaut: 0,9835 (proche de 1)
 On trouve l’intervalle
[ 0,193 ; 0,367 ]
15 / 15
Téléchargement