S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Moyenne
Université de Picardie Jules Verne 2011-2012
UFR des Sciences
Licence mention Mathématiques et mention Informatique parcours MIAGE -Semestre 3
Statistique et Probabilités
Estimation, intervalle de confiance, test statistique (suite)
Cas d’une ou de deux moyennes, d’une ou de deux variances
1.Introduction
On s’intéresse à l’étude d’un caractère (quantitatif ou qualitatif) des Nindividus d’une population. Pour
chacun des individus de la population, le caractère peut a priori prendre des valeurs aléatoirement différentes.
Ainsi, le caractère peut être représenter par une variable aléatoire X.
Lorsque le caractère est quantitatif (taille des individus,...), Xsera une variable aléatoire égale aux
valeurs du caractère ; on supposera en général que Xest une variable aléatoire d’espérance mathématique
(moyenne), d’écart-type , et éventuellement de loi normale.
Lorsqu’on n’a pas accès à l’ensemble de la population, on procède à un échantillonnage, i.e. au choix de
nindividus dans la population, sur lesquels on observe la valeur xdu caractère X. On aura ainsi un échantillon
X
1
,X
2
,...,X
n
est un échantillon de taille nde X; pour tout i1,...,n, la variable aléatoire X
i
correspond
aux valeurs du caractère du i-ème individu obtenu par échantillonage, et aura donc la même loi de
probabilité que X. De plus, l’échantillonnage étant non-exhaustif (tirages avec remise), les variables
aléatoires X
i
sont indépendantes.
Exemple introductif sur la moyenne
On considère un groupe de quatre enfants, Alexis, Benjamin, Cyril et David, d’âges respectifs 12, 13, 14
et 15 ans. Lorsqu’on choisit un enfant au hasard dans le groupe, on peut considérer :
-X, âge de l’enfant, variable aléatoire de loi uniforme sur 12,13,14,15:
PX12PX151
4, de moyenne 13,5 et d’écart-type 1.25 1.118 ;
Cherchons à retrouver ou à approcher ces résultats à partir d’échantillons non-exhaustifs (avec remise) de
taille n3. Il y en a 4
3
64, ils forment un univers
, ensemble des résultats possibles de l’expérience
aléatoire "choisir un échantillon". On peut munir
de la tribu des événements A
P
et de
l’équiprobabilité P
sur
,A
. A chacun des résultats (échantillons) , on peut associer la moyenne
Xxdes âges de l’échantillon. On obtient les résultats présentés dans le tableau page 2.
On définit ainsi une variable aléatoire X, dont on peut obtenir la loi de probabilité :
x
i
12,00 12,33 12,67 13,00 13,33 13,67 14,00 14,33 14,67 15,00
PXx
i
1/64 3/64 6/64 10/64 12/64 12/64 10/64 6/64 3/64 1/64
On peut alors calculer :
-EX
x
i
PXx
i
13,5 : on remarque que EXEX.
-VarX
x
i
2
PXx
i
EX
2
5
12 : on remarque que VarX
2
nVarX
n.
2.Estimateur -Estimation
2.1.Moyenne et variance déchantillon
Considérons un caractère quantitatif représenté par une variable aléatoire Xd’espérance mathématique ,
d’écart-type , et un échantillon X
1
,X
2
,...,X
n
de taille nde X.
Pour chaque échantillonnage on peut calculer la moyenne observée du caractère x1
n
i1
n
x
i
,
x
1
n
i1
n
x
i
, ... Ces moyennes observées peuvent être considérées comme les valeurs observées de la
variable aléatoire XX
n
1
n
i1
n
X
i
,moyenne déchantillon.
Stéphane Ducay
1
S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Moyenne
x
A,A,A12
A,A,B12,33
A,A,C12,67
A,A,D13
A,B,A12,33
A,B,B12,67
A,B,C13
A,B,D13,33
A,C,A12,67
A,C,B13
A,C,C13,33
A,C,D13,67
A,D,A13
A,D,B13,33
A,D,C13,67
A,D,D14
x
B,A,A12,33
B,A,B12,67
B,A,C13
B,A,D13,33
B,B,A12,67
B,B,B13
B,B,C13,33
B,B,D13,67
B,C,A13
B,C,B13,33
B,C,C13,67
B,C,D14
B,D,A13,33
B,D,B13,67
B,D,C14
B,D,D14,33
x
C,A,A12,67
C,A,B13
C,A,C13,33
C,A,D13,67
C,B,A13
C,B,B13,33
C,B,C13,67
C,B,D14
C,C,A13,33
C,C,B13,67
C,C,C14
C,C,D14,33
C,D,A13,67
C,D,B14
C,D,C14,33
C,D,D14,67
x
D,A,A13
D,A,B13,33
D,A,C13,67
D,A,D14
D,B,A13,33
D,B,B13,67
D,B,C14
D,B,D14,33
D,C,A13,67
D,C,B14
D,C,C14,33
D,C,D14,67
D,D,A14
D,D,B14,33
D,D,C14,67
D,D,D15
On démontre que EX(on dit que Xest un estimateur sans biais de ) et VarX
2
n.
Pour une observation x
1
,x
2
,...,x
n
de l’échantillon, on dit que x1
n
i1
n
x
i
est une estimation
ponctuelle de .
De même, on considère la variance déchantillon S
2
S
n
2
1
n
i1
n
X
i
X
2
1
n
i1
n
X
i
2
X
2
.
On a alors ES
2
n1
n
2
et S
2
est un estimateur avec biais de
2
. On considère alors la variance
corrigée déchantillon S
c
2
n
n1S
2
: on a alors ES
c
2
2
et S
c
2
est un estimateur sans biais de
2
.
Pour une observation x
1
,x
2
,...,x
n
de l’échantillon, une estimation ponctuelle de
2
est
s
c
2
n
n1s
2
2
avec s
2
1
n
i1
n
x
i
2
x
2
.
2.2.Loi de probabilité des estimateurs
Cas dun petit échantillon gaussien :n30 et Xde loi normale N;
Si est connu (cas peu utile en pratique), alors UX
nsuit la loi normale N0;1.
Si est inconnu, alors TX
S
c
n
suit la loi de Student à n1 degrés de liberté.
Cas dun grand échantillon :n30 (et Xde loi quelconque)
Dans ce cas, UX
S
c
n
suit approximativement la loi normale N0;1.
Cas dun échantillon gaussien :Xde loi normale N;
Dans ce cas, Y
2
n1
2
S
c
2
suit la loi de khi deux à n1 degrés de liberté.
Stéphane Ducay
2
S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Moyenne
3.Intervalle de confiance
3.1.Pour une moyenne
Considérons un caractère quantitatif représenté par une variable aléatoire Xd’espérance mathématique ,
d’écart-type , et un échantillon X
1
,X
2
,...,X
n
de taille nde X. La moyenne d’échantillon est X1
n
i1
n
X
i
et la variance corrigée d’échantillon est S
c
2
n
n1S
2
, avec S
2
1
n
i1
n
X
i
X
2
1
n
i1
n
X
i
2
X
2
.
3.1.1.Cas dun petit échantillon gaussien :n30 et Xde loi normale N;
3.1.1.1.Cas connu (peu utile en pratique)
On sait que UX
nsuit la loi normale N0;1.
On fixe une valeur 0,1. On peut trouver un réel u
tel que Pu
Uu
1(voir table 2).
On a alors 1 Pu
X
n
u
P
nu
X
nu
PX
nu
X
nu
P X
nu
X
nu
.
On dit que I
X
nu
,X
nu
est un intervalle de confiance de au niveau 1(ou au
seuil ). En pratique, on a une observation xde X, d’où une observation de cet intervalle :
i
x
nu
,x
nu
.
3.1.1.2.Cas inconnu
On sait que TX
S
c
n
suit la loi de Student à n1 degrés de liberté.
On détermine alors le réel t
tel que Pt
Tt
1(table 3). On en déduit un intervalle de
confiance de au niveau 1:
i
xs
c
nt
,xs
c
nt
.
3.1.2.Cas dun grand échantillon :n30
On sait que UX
S
c
n
suit approximativement la loi normale N0;1. On procède alors comme au
3.1.1.1. en remplaçant par s
c
et on obtient un intervalle de confiance approché de au niveau 1:
i
xs
c
nu
,xs
c
nu
3.2.Pour une variance
2
Considérons un caractère quantitatif représenté par une variable aléatoire Xde loi normale N;, et un
échantillon X
1
,X
2
,...,X
n
de taille nde X. La moyenne d’échantillon est Xet la variance corrigée
d’échantillon est S
c
2
n
n1S
2
.
Alors Y
2
n1
2
S
c
2
suit la loi de khi deux à n1 degrés de liberté.
On détermine alors les réels a
et b
tels que PY
2
a
1
2et PY
2
b
2(table 4).
On a alors
1P a
n1
2
S
c
2
b
P1
b
2
n1S
c
2
1
a
Pn1S
c
2
b
2
n1S
c
2
a
.
On en déduit un intervalle de confiance de la variance
2
au niveau 1:
i
2
n1
b
s
c
2
,n1
a
s
c
2
.
Stéphane Ducay
3
S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Moyenne
3.3.Exemple
Un échantillon de 30 enfants d’une ville donnée à fourni les tailles suivantss (en cm) :
70 85 93 99 101 105 110 121 138 166
74 85 93 99 102 106 110 125 140 180
79 87 94 99 102 107 114 128 147 180
On peut considérer la situation suivante.
Population : les enfants de la ville considérée.
Caractère : la taille, variable aléatoire de moyenne et de variance
2
(écart-type ).
Echantillon X
1
,X
2
,...,X
n
de taille n30 de X.
Observation de l’échantillon : x
1
,x
2
,...,x
n
70,74,79,...,180.
1) Estimateurs
a) de la moyenne :X1
n
i1
n
X
i
; b) de la variance
2
:S
c
2
n
n1S
2
, avec S
2
1
n
i1
n
X
i
2
X
2
.
2) Estimations ponctuelles
a) de la moyenne :x1
n
i1
n
x
i
1
30 3339 111,3 ;
b) de la variance
2
:s
2
1
n
i1
n
x
i
2
x
2
1
30 395347 111,3
2
790,54 ;
et donc s
c
2
n
n1s
2
30
29 790,54 817,80 ;
c) de l’écart-type :s
c
s
c
2
28,60.
3) Intervalle de confiance
a) de la moyenne
1ère méthode : X supposée de loi normale N;,inconnu
TX
S
c
n
suit la loi de Student à n1 degrés de liberté.
On détermine le réel t
tel que Pt
Tt
1(table 3).
On en déduit un intervalle de confiance de au niveau 1 :i
xs
c
nt
;xs
c
nt
.
On a n30 et n129. Pour 0,05 (i.e. 5%, on a t
2,045,
et donc un intervalle de confiance de au niveau 0,95 (i.e. 95%) est i
100,6 ; 122,0 .
2ème méthode : grand échantillon (n 30, pas d’hypothèse sur la loi de X)
UX
S
c
n
suit approximativement la loi normale N0;1.
On détermine le réel u
tel que Pu
Uu
1.
On en déduit un intervalle de confiance de au niveau 1 :i
xs
c
nu
;xs
c
nu
.
On a n30. Pour 0,05 (i.e. 5%, on a u
1,96,
et donc un intervalle de confiance de au niveau 0,95 (i.e. 95%) est i
101,1 ; 121,5 .
b) de la variance
2
:Xsupposée de loi normale N;
Y
2
n1
2
S
c
2
suit la loi de khi deux à n1 degrés de liberté.
On détermine alors les réels a
et b
tels que PY
2
a
1
2et PY
2
b
2(table 4).
On en déduit un intervalle de confiance de
2
au niveau 1 :i
2
n1
b
s
c
2
;n1
a
s
c
2
.
On a n30 et n129. Pour 0,05 (i.e. 5%, on a a
16,05 et b
45,72,
et donc un intervalle de confiance de
2
au niveau 0,95 (i.e. 95%) est i
2
518,73 ; 1477,65 .
Stéphane Ducay
4
S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Moyenne
4.Test de conformité
4.1.Pour une moyenne
Considérons un caractère quantitatif représenté par une variable aléatoire Xd’espérance mathématique ,
d’écart-type , et un échantillon X
1
,X
2
,...,X
n
de taille nde X. La moyenne d’échantillon est X1
n
i1
n
X
i
et la variance corrigée d’échantillon est S
c
2
n
n1S
2
, avec S
2
1
n
i1
n
X
i
X
2
1
n
i1
n
X
i
2
X
2
.
4.1.1.Cas dun petit échantillon gaussien :n30 et Xde loi normale N;
4.1.1.1.Cas connu (exemple introductif)
Il s’agit de faire un choix entre plusieurs hypothèses possibles sur sans disposer d’informations
suffisantes pour que ce choix soit sûr. On met en avant deux hypothèses privilégiées : l’hypothèse nulle H
0
et
l’hypothèse alternative H
1
. Par exemple, on testera H
0
:
0
contre H
1
:
0
, avec
0
fixé
arbitrairement. On veut savoir si l’on doit rejeter H
0
ou pas.
Test (bilatéral) de H
0
:
0
contre H
1
:
0
.
On utilise alors une variable aléatoire dont on connait la loi de probabilité lorsque H
0
est vraie. Par
exemple UX
n, car lorsque H
0
est vraie, on sait que UX
0
nsuit la loi N0;1.
On fixe une valeur 0,1. En général, on prend petit, le plus souvent 0,05, 0,01, 0,001. On peut
trouver un réel u
tel que Pu
Uu
1. Ce réel u
peut être trouvé dans la table 2.
On est donc amené à comparer la moyenne Xde l’échantillon à la moyenne théorique
0
.
L’hypothèse H
0
signifiera que les différences observées sont seulement dûes aux fluctuations
d’échantillonnage (i.e. ne sont pas significatives).
On ne rejettera pas H
0
si les différences observées ne sont pas significatives, c’est-à-dire si Uest "petite",
ce que l’on peut traduire par u
Uu
, c’est-à-dire |U|u
.
On rejetera donc H
0
si les différences observées sont significatives, ce que l’on peut traduire par Uu
ou Uu
, c’est-à-dire |U|u
. Par construction de u
, on a PUu
PUu
2, soit encore
P|U|u
, i.e. PUu
,u
.
En pratique, on calcule ux
0
net on décide
- de rejeter H
0
si uu
,u
, car si H
0
était vraie, l’événement Uu
,u
aurait une probabili
faible de se réaliser ; on pourra dire que la valeur observée xn’est pas conforme à la valeur théorique
0
mais
on ne pourra pas donner de valeur acceptable de ;
- de ne pas rejeter H
0
si uu
,u
, car si H
0
était vraie, l’événement Uu
,u
aurait une
probabilité forte de se réaliser ; on pourra dire que la valeur observée xest conforme à la valeur théorique
0
et que la valeur
0
ne peut être rejeter. Attention : d’autres valeurs
0
,
0

, ... peuvent également convenir.
Erreurs de décision.
Lorsqu’on rejette H
0
alors que H
0
est vraie, on commet une erreur. On a donc une probabilité de se
tromper : est appelée erreur de première espèce. En effet, lorsque H
0
est vraie, on a
PUu
,u
.
Lorsque l’on ne rejette pas H
0
alors que H
0
est fausse, on commet une erreur. On a une probabilité de
se tromper : est appelée erreur de deuxième espèce. Cette erreur est difficilement calculable. La plupart
du temps, on ne connait pas la loi de Ulorsque H
0
est fausse. La valeur 1 est appelée la puissance du
test.
Test (unilatéral) de H
0
:
0
contre H
1
:
0
.
On détermine u
tel que PUu
, i.e. PUu
1, i.e. u
1
1u
2
, et on décide
que :
- si uu
, alors on ne peut rejeter H
0
;
- si uu
, alors on rejette H
0
avec une probabilité de se tromper.
Stéphane Ducay
5
1 / 17 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !