S3 Maths 2014-2015 Statistique Estimation, intervalle de confiance, tests - Moyenne, variance
Université de Picardie Jules Verne 2014-2015
UFR des Sciences
Licence mention Mathématiques -Semestre 3
Statistique
Estimation, intervalle de confiance, test statistique (suite)
Cas d’une ou de deux moyennes, d’une ou de deux variances
1.Introduction
On s’intéresse à l’étude d’un caractère (quantitatif ou qualitatif) des Nindividus d’une population. Pour
chacun des individus de la population, le caractère peut a priori prendre des valeurs aléatoirement différentes.
Ainsi, le caractère peut être représenter par une variable aléatoire X.
Lorsque le caractère est quantitatif (taille des individus,...), Xsera une variable aléatoire égale aux
valeurs du caractère ; on supposera en général que Xest une variable aléatoire d’espérance mathématique
(moyenne), d’écart-type , et éventuellement de loi normale.
Lorsqu’on n’a pas accès à l’ensemble de la population, on procède à un échantillonnage, i.e. au choix de
nindividus dans la population, sur lesquels on observe la valeur xdu caractère X. On aura ainsi un échantillon
X1,X2,...,Xnest un échantillon de taille nde X; pour tout i1,...,n, la variable aléatoire Xicorrespond
aux valeurs du caractère du ime individu obtenu par échantillonage, et aura donc la même loi de
probabilité que X. De plus, l’échantillonnage étant non-exhaustif (tirages avec remise), les variables
aléatoires Xisont indépendantes.
Exemple introductif sur la moyenne
On considère un groupe de quatre enfants, Alexis, Benjamin, Cyril et David, d’âges respectifs 12, 13, 14
et 15 ans. Lorsqu’on choisit un enfant au hasard dans le groupe, on peut considérer :
-X, âge de l’enfant, variable aléatoire de loi uniforme sur 12,13,14,15:
PX12PX151
4, de moyenne 13,5 et d’écart-type 1.25 1.118 ;
Cherchons à retrouver ou à approcher ces résultats à partir d’échantillons non-exhaustifs (avec remise) de
taille n3. Il y en a 4364, ils forment un univers , ensemble des résultats possibles de l’expérience
aléatoire "choisir un échantillon". On peut munir de la tribu des événements APet de
l’équiprobabilité Psur ,A. A chacun des résultats (échantillons) , on peut associer la moyenne
Xxdes âges de l’échantillon. On obtient les résultats présentés dans le tableau page 2.
On définit ainsi une variable aléatoire X, dont on peut obtenir la loi de probabilité :
xi12,00 12,33 12,67 13,00 13,33 13,67 14,00 14,33 14,67 15,00
PXxi1/64 3/64 6/64 10/64 12/64 12/64 10/64 6/64 3/64 1/64
On peut alors calculer :
-EX
xiPXxi13,5 : on remarque que EXEX.
-VarX
xi
2PXxiEX25
12 : on remarque que VarX2
nVarX
n.
2.Estimateur -Estimation
2.1.Moyenne et variance déchantillon
Considérons un caractère quantitatif représenté par une variable aléatoire Xd’espérance mathématique ,
d’écart-type , et un échantillon X1,X2,...,Xnde taille nde X.
Pour chaque échantillonnage on peut calculer la moyenne observée du caractère x1
n
i1
nxi,
x1
n
i1
nxi
, ... Ces moyennes observées peuvent être considérées comme les valeurs observées de la
variable aléatoire XXn1
n
i1
nXi,moyenne déchantillon.
Stéphane Ducay
1
S3 Maths 2014-2015 Statistique Estimation, intervalle de confiance, tests - Moyenne, variance
x
A,A,A12
A,A,B12,33
A,A,C12,67
A,A,D13
A,B,A12,33
A,B,B12,67
A,B,C13
A,B,D13,33
A,C,A12,67
A,C,B13
A,C,C13,33
A,C,D13,67
A,D,A13
A,D,B13,33
A,D,C13,67
A,D,D14
x
B,A,A12,33
B,A,B12,67
B,A,C13
B,A,D13,33
B,B,A12,67
B,B,B13
B,B,C13,33
B,B,D13,67
B,C,A13
B,C,B13,33
B,C,C13,67
B,C,D14
B,D,A13,33
B,D,B13,67
B,D,C14
B,D,D14,33
x
C,A,A12,67
C,A,B13
C,A,C13,33
C,A,D13,67
C,B,A13
C,B,B13,33
C,B,C13,67
C,B,D14
C,C,A13,33
C,C,B13,67
C,C,C14
C,C,D14,33
C,D,A13,67
C,D,B14
C,D,C14,33
C,D,D14,67
x
D,A,A13
D,A,B13,33
D,A,C13,67
D,A,D14
D,B,A13,33
D,B,B13,67
D,B,C14
D,B,D14,33
D,C,A13,67
D,C,B14
D,C,C14,33
D,C,D14,67
D,D,A14
D,D,B14,33
D,D,C14,67
D,D,D15
On démontre que EX(on dit que Xest un estimateur sans biais de ) et VarX2
n.
Pour une observation x1,x2,...,xnde l’échantillon, on dit que x1
n
i1
nxi
est une estimation
ponctuelle de .
De même, on considère la variance déchantillon S2Sn
21
n
i1
nXiX21
n
i1
nXi
2X2.
On a alors ES2n1
n2et S2est un estimateur avec biais de 2. On considère alors la variance
corrigée déchantillon Sc
2n
n1S2: on a alors ESc
22et Sc
2est un estimateur sans biais de 2.
Pour une observation x1,x2,...,xnde l’échantillon, une estimation ponctuelle de 2est
sc
2n
n1s22avec s21
n
i1
nxi
2x2.
2.2.Loi de probabilité des estimateurs
Cas dun petit échantillon gaussien :n30 et Xde loi normale N;
Si est connu (cas peu utile en pratique), alors UX
nsuit la loi normale N0;1.
Si est inconnu, alors TX
Sc
n
suit la loi de Student à n1 degrés de liberté.
Cas dun grand échantillon :n30 (et Xde loi quelconque)
Dans ce cas, UX
Sc
n
suit approximativement la loi normale N0;1.
Cas dun échantillon gaussien :Xde loi normale N;
Dans ce cas, Y2n1
2Sc
2suit la loi de khi deux à n1 degrés de liberté.
Stéphane Ducay
2
S3 Maths 2014-2015 Statistique Estimation, intervalle de confiance, tests - Moyenne, variance
3.Intervalle de confiance
3.1.Pour une moyenne
Considérons un caractère quantitatif représenté par une variable aléatoire Xd’espérance mathématique ,
d’écart-type , et un échantillon X1,X2,...,Xnde taille nde X. La moyenne d’échantillon est X1
n
i1
nXi
et la variance corrigée d’échantillon est Sc
2n
n1S2, avec S21
n
i1
nXiX21
n
i1
nXi
2X2.
3.1.1.Cas dun petit échantillon gaussien :n30 et Xde loi normale N;
3.1.1.1.Cas connu (peu utile en pratique)
On sait que UX
nsuit la loi normale N0;1.
On fixe une valeur 0,1. On peut trouver un réel utel que PuUu1(voir table 2).
On a alors 1 PuX
n
uP
nuX
nu
PX
nuX
nuP X
nuX
nu.
On dit que IX
nu,X
nuest un intervalle de confiance de au niveau 1(ou au
seuil ). En pratique, on a une observation xde X, d’où une observation de cet intervalle :
ix
nu,x
nu.
3.1.1.2.Cas inconnu
On sait que TX
Sc
n
suit la loi de Student à n1 degrés de liberté.
On détermine alors le réel ttel que PtTt1(table 3). On en déduit un intervalle de
confiance de au niveau 1:
ixsc
nt,xsc
nt.
3.1.2.Cas dun grand échantillon :n30
On sait que UX
Sc
n
suit approximativement la loi normale N0;1. On procède alors comme au
3.1.1.1. en remplaçant par scet on obtient un intervalle de confiance approché de au niveau 1:
ixsc
nu,xsc
nu
3.2.Pour une variance 2
Considérons un caractère quantitatif représenté par une variable aléatoire Xde loi normale N;, et un
échantillon X1,X2,...,Xnde taille nde X. La moyenne d’échantillon est Xet la variance corrigée
d’échantillon est Sc
2n
n1S2.
Alors Y2n1
2Sc
2suit la loi de khi deux à n1 degrés de liberté.
On détermine alors les réels aet btels que PY2a1
2et PY2b
2(table 4).
On a alors
1P an1
2Sc
2bP1
b
2
n1Sc
21
aPn1Sc
2
b
2n1Sc
2
a.
On en déduit un intervalle de confiance de la variance 2au niveau 1:
i
2
n1
bsc
2,n1
asc
2.
Stéphane Ducay
3
S3 Maths 2014-2015 Statistique Estimation, intervalle de confiance, tests - Moyenne, variance
3.3.Exemple
Un échantillon de 30 enfants d’une ville donnée à fourni les tailles suivantss (en cm) :
70 85 93 99 101 105 110 121 138 166
74 85 93 99 102 106 110 125 140 180
79 87 94 99 102 107 114 128 147 180
On peut considérer la situation suivante.
Population : les enfants de la ville considérée.
Caractère : la taille, variable aléatoire de moyenne et de variance 2(écart-type ).
Echantillon X1,X2,...,Xnde taille n30 de X.
Observation de l’échantillon : x1,x2,...,xn70,74,79,...,180.
1) Estimateurs
a) de la moyenne :X1
n
i1
nXi; b) de la variance 2:Sc
2n
n1S2, avec S21
n
i1
nXi
2X2.
2) Estimations ponctuelles
a) de la moyenne :x1
n
i1
nxi1
30 3339 111,3 ;
b) de la variance 2:s21
n
i1
nxi
2x21
30 395347 111,32790,54 ;
et donc sc
2n
n1s230
29 790,54 817,80 ;
c) de l’écart-type :scsc
228,60.
3) Intervalle de confiance
a) de la moyenne
1ère méthode : X supposée de loi normale N;,inconnu
TX
Sc
n
suit la loi de Student à n1 degrés de liberté.
On détermine le réel ttel que PtTt1(table 3).
On en déduit un intervalle de confiance de au niveau 1 :ixsc
nt;xsc
nt.
On a n30 et n129. Pour 0,05 (i.e. 5%, on a t2,045,
et donc un intervalle de confiance de au niveau 0,95 (i.e. 95%) est i100,6 ; 122,0 .
2ème méthode : grand échantillon (n 30, pas d’hypothèse sur la loi de X)
UX
Sc
n
suit approximativement la loi normale N0;1.
On détermine le réel utel que PuUu1.
On en déduit un intervalle de confiance de au niveau 1 :ixsc
nu;xsc
nu.
On a n30. Pour 0,05 (i.e. 5%, on a u1,96,
et donc un intervalle de confiance de au niveau 0,95 (i.e. 95%) est i101,1 ; 121,5 .
b) de la variance 2:Xsupposée de loi normale N;
Y2n1
2Sc
2suit la loi de khi deux à n1 degrés de liberté.
On détermine alors les réels aet btels que PY2a1
2et PY2b
2(table 4).
On en déduit un intervalle de confiance de 2au niveau 1 :i
2
n1
bsc
2;n1
asc
2.
On a n30 et n129. Pour 0,05 (i.e. 5%, on a a16,05 et b45,72,
et donc un intervalle de confiance de 2au niveau 0,95 (i.e. 95%) est i
2
518,73 ; 1477,65 .
Stéphane Ducay
4
S3 Maths 2014-2015 Statistique Estimation, intervalle de confiance, tests - Moyenne, variance
4.Test de conformité
4.1.Pour une moyenne
Considérons un caractère quantitatif représenté par une variable aléatoire Xd’espérance mathématique ,
d’écart-type , et un échantillon X1,X2,...,Xnde taille nde X. La moyenne d’échantillon est X1
n
i1
nXi
et la variance corrigée d’échantillon est Sc
2n
n1S2, avec S21
n
i1
n
XiX21
n
i1
nXi
2X2.
4.1.1.Cas dun petit échantillon gaussien :n30 et Xde loi normale N;
4.1.1.1.Cas connu (exemple introductif)
Il s’agit de faire un choix entre plusieurs hypothèses possibles sur sans disposer d’informations
suffisantes pour que ce choix soit sûr. On met en avant deux hypothèses privilégiées : l’hypothèse nulle H0et
l’hypothèse alternative H1. Par exemple, on testera H0:0contre H1:0, avec 0fixé
arbitrairement. On veut savoir si l’on doit rejeter H0ou pas.
Test (bilatéral) de H0:0contre H1:0.
On utilise alors une variable aléatoire dont on connait la loi de probabilité lorsque H0est vraie. Par
exemple UX
n, car lorsque H0est vraie, on sait que UX0
nsuit la loi N0;1.
On fixe une valeur 0,1. En général, on prend petit, le plus souvent 0,05, 0,01, 0,001. On peut
trouver un réel utel que PuUu1. Ce réel upeut être trouvé dans la table 2.
On est donc amené à comparer la moyenne Xde l’échantillon à la moyenne théorique 0.
L’hypothèse H0signifiera que les différences observées sont seulement dûes aux fluctuations
d’échantillonnage (i.e. ne sont pas significatives).
On ne rejettera pas H0si les différences observées ne sont pas significatives, c’est-à-dire si Uest "petite",
ce que l’on peut traduire par uUu, c’est-à-dire |U|u.
On rejetera donc H0si les différences observées sont significatives, ce que l’on peut traduire par Uu
ou Uu, c’est-à-dire |U|u. Par construction de u, on a PUuPUu
2, soit encore
P|U|u, i.e. PUu,u.
En pratique, on calcule ux0
net on décide
- de rejeter H0si uu,u, car si H0était vraie, l’événement Uu,uaurait une probabili
faible de se réaliser ; on pourra dire que la valeur observée xn’est pas conforme à la valeur théorique 0mais
on ne pourra pas donner de valeur acceptable de ;
- de ne pas rejeter H0si uu,u, car si H0était vraie, l’événement Uu,uaurait une
probabilité forte de se réaliser ; on pourra dire que la valeur observée xest conforme à la valeur théorique 0
et que la valeur 0ne peut être rejeter. Attention : d’autres valeurs 0
,0
, ... peuvent également convenir.
Erreurs de décision.
Lorsqu’on rejette H0alors que H0est vraie, on commet une erreur. On a donc une probabilité de se
tromper : est appelée erreur de première espèce. En effet, lorsque H0est vraie, on a
PUu,u.
Lorsque l’on ne rejette pas H0alors que H0est fausse, on commet une erreur. On a une probabilité de se
tromper : est appelée erreur de deuxième espèce. Cette erreur est difficilement calculable. La plupart du
temps, on ne connait pas la loi de Ulorsque H0est fausse. La valeur 1 est appelée la puissance du test.
Test (unilatéral) de H0:0contre H1:0.
On détermine u
tel que PUu
, i.e. PUu
1, i.e. u
11u2, et on décide
que :
- si uu
, alors on ne peut rejeter H0;
- si uu
, alors on rejette H0avec une probabilité de se tromper.
Stéphane Ducay
5
1 / 17 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !