TP 3 corrige

publicité
TP2: Statistique & Probabilité
Intervalle de confiance et
test d’hypothèses
σ² connue
μ  X  zα
σ
n
σ² inconnue
n
grand
n petit
<120
μ  X  zα
s
μ  X  tα
s
n
n
Loi
Normale
Loi de Student
à n-1 ddl
2 échantillons indépendants (et donc à covariance nulle!)
σ² connues – loi normale
( 1 -  2 )  (X1  X 2 )  z α
 12
n1

 22
n2
σ² inconnues mais supposées égales
Grand échantillon – Normal avec s²
( 1 -  2 )  (X1  X 2 )  z α
s12 s2 2

n1
n2
Petit échantillon - Student ddl= (n1-1) + (n2-1)
( 1 -  2 )  (X1  X 2 )  t α s p
sp
2

(X
1i
1
1

n1 n2
 X1 )2   ( X 2i  X 2 )2
(n1  1)  (n2  1)
2 échantillons appariés (2x même phénomène; différence = variable)
  D  tα
sD
n
Grand échantillon
1. Pour une proportion π
  P  zα
P(1 - P)
n
2. Pour une différence de proportions
( 1 -  2 )  (P1  P2 )  z α
P1 (1  P1 ) P2 (1  P2 )

n1
n2
Note: Pour un petit échantillon, Student ne s’applique pas.
Question 1
De manière aléatoire, on a tiré un petit échantillon de 10
cotes provenant d'un concours national en calcul
statistique. Ces cotes sont les suivantes :
71
74
65
72
64
63
62
62
60
80
(a) Calculez la moyenne et l'écart-type de cet
échantillon.
(b) Construisez un intervalle de confiance (95%) pour la
moyenne des cotes du concours national.
avec fi fréquence absolue
Question 1
(a)Moyenne de l'échantillon
= ∑ Xi / n = 673 / 10 = 67,3.
La cote moyenne est de 67,3 pts.
Variance et écart-type d’échantillon:
s2 = ∑ (Xi – X )2 / n-1
= 386,1 / 9 = 42,9
s = 6,55.
(Xi –X) (Xi – X )²
71
74
65
72
64
63
62
62
60
80
X =67,3
3,7
6,7
-2,3
4,7
-3,3
-4,3
-5,3
-5,3
-7,3
12,7
0
13,69
44,89
5,29
22,09
10,89
18,49
28,09
28,09
53,29
161,29
386,1
avec fi fréquence absolue
Question 1
(b) L'intervalle de confiance pour la moyenne d'une
population pour laquelle la variance exacte (σ²) est
inconnue est déterminé à l'aide de l'écart-type de
l'échantillon (s) et de la distribution du t de Student
avec dll = 9.
μ = X ± t.025 s / √n
μ = 67,3 ± 2,26 * 6,55 /√10
= 67,3 ± 4,68
μ Є [62,62 ; 71,98]
avec fi fréquence absolue
Question 2
Le propriétaire d'un élevage de poulets s'intéresse au
poids moyen des animaux prêts à la vente issus de
son établissement. Il a tiré au hasard un échantillon
de 8 poulets prêts à la vente. La pesée a donné les
résultats suivants (poids exprimés en grammes) :
900
887
995 1015 1037 754
955 1086
(a) Calculez la moyenne et l'écart-type de cet
échantillon.
(b) Construisez un intervalle de confiance (95%) pour
la moyenne des animaux prêts à la vente.
Question 2
(a) Moyenne de l'échantillon
= ∑ Xi / n
= 7629 / 8 = 953,6.
Le poids moyen des poulets
prêts à la vente, repris dans
l'échantillon est de 953,6 gr.
Variance
= s2 = ∑ (Xi – X)2 / n-1
= 77119,87 / 7 = 11017,12
Ecart-type = s = 105,0.
(Xi –X)
(Xi – X )²
900
887
995
1015
1037
754
955
1086
-53,625
-66,625
41,375
61,375
83,375
-199,625
1,375
132,375
2875,64
4438,89
1711,89
3766,89
6951,39
39850,14
1,89
17523,14
953,6
0
77119,87
Question 2
(b) L'intervalle de confiance pour la moyenne
d'une population pour laquelle la variance exacte
(σ²) est inconnue est déterminé à l'aide de l'écarttype de l'échantillon (s) et de la distribution du t de
Student avec dll = 7.
Ainsi,
μ = X ± t.025 s / √n
μ = (953,6 ± 2,36 * 105 /√8)
= 953,6 ± 87,61
μ Є [865,99 ; 1041,21]
Question 3
Considérons deux échantillons indépendants d'hommes et de
femmes dont on observe le salaire hebdomadaire (en milliers de
francs) :
Hommes
12
11
19
16
22
Femmes
9
12
8
10
16
Calculez un intervalle de confiance (95%) pour la différence
entre la moyenne des salaires hebdomadaires des hommes et
celle des salaires hebdomadaires des femmes de la population.
Question 3
2 échantillons indépendants (et donc à covariance nulle!)
σ² inconnues mais supposées égales
Petit échantillon - Student ddl= (n1-1) + (n2-1)
( 1 -  2 )  (X1  X 2 )  t α s p
sp
2

(X
1i
1
1

n1 n2
 X1 )2   ( X 2i  X 2 )2
(n1  1)  (n2  1)
Intervalle de confiance pour la différence entre la moyenne des
salaires perçus d'une part, par les hommes et d'autre part, par les
femmes, nous allons devoir appliquer la formule suivante :
μH - μF = ( XH - XF) ± t.025 sp * √(1/nH + 1/nF)
Question 3
Moyenne des hommes = XH = ∑ XiH / n = 80 / 5 = 16.
Moyenne des femmes = XF = ∑ XiF / n = 55 / 5 = 11.
t.025 avec dll = (n1-1) + (n2-1) = (5-1)+(5-1) = 8
t.025 = 2,31
la variance commune est estimée comme suit :
sp2 = {∑ (XiH – XH)2 + ∑ (XiF – X F)2} / {(nH - 1) + (nF – 1)}
sp2 = (86 + 40) / (4 + 4) = 15,75
Ecart-type commun = sp = 3,968
L'intervalle de confiance à 95% :
μH - μF = ((16 - 11) ± 2,31 * 3,97 *√(1/5) + (1/5)) = (5 ± 5,78)
μH - μF Є [-0,78 ; 10,78 ]
Question 3
Supplément pour calcul variance d’échantillons
Variance pour les hommes = sH2 = ∑ (XiH – XH)2 / n-1 = 86 / 4 = 21,5.
Ecart-type pour les hommes = sH = 4,64.
Variance pour les femmes = sF2 = ∑ (XiF – XF)2 / n-1 = 40 / 4 = 10.
Ecart-type pour les femmes = sF = 3,16.
Calcul des valeurs critiques du test
Par exemple pour le test de la moyenne :
H0: µ ≤ C
H1: µ > C
Valeur de Z ou de T sous H0
Zc 
Tc 
Tc 
X -c
σ/ n
X -c
s/ n
P-c
P(1 - P)
n
Z car σ est connue et donc une loi
normale
σ inconnue, on utilise s calculée sur l’
échantillon; on a une loi de Student
Cas d’une proportion, la variance d’
échantillon est donnée par P(1-P)/n
On a une loi de Student
Question 4
Un juge américain de la ville de Boston a, au cours de sa carrière,
désigné 700 personnes faisant partie de la population de la ville
pour être jurés lors de ses procès. 15% de ces personnes étaient des
femmes. Or, la ville de Boston compte 29% de femmes éligibles à
cette fonction.
(a) Si π désigne la probabilité qu'un juré choisi par le juge soit une
femme, comment doit être libellé H0 pour tester l'impartialité du
juge dans son choix quant au sexe ?
(b) Calculez la probabilité critique (p.c.) unilatérale pour H0 ?
(c) Au seuil de α = 5%, peut-on rejeter H0 ?
Question 4
(a) Puisqu'il y a 29% de femmes éligibles à la fonction de juré dans
la ville de Boston, l'hypothèse nulle d'impartialité de choix du juge
doit donc être : H0 : π = 0,29.
(b)
Tc 
P-c
P(1 - P)
n
P = 0,15
Ecart-type estimé = √(0,15 * 0,85 / 700) = 0,01349
t = (0,15 – 0,29) / 0,01349 = -10,4.
Prob (P ≤ π )= Prob (T ≤ t = -10,4) = Prob (T ≥ t = 10,4)  0
Pour un grand échantillon (n = 700), on peut consulter les tables de
la loi normale ou de la loi de Student. On constate ainsi que la
probabilité que Z > 10,4 ou T > 10,4 est très faible et proche de zéro.
En conclusion, la crédibilité de l'hypothèse nulle d'impartialité du
juge est très faible !
Question 4
(c)
Prob (P ≤ π ) = Prob (T ≤ t = (P - π) / sp )
= Prob (T ≥ -t = -(P - π) / sp ) = 0,05
Par symétrie, on observe que la valeur critique du t de Student pour
un seuil de 5% (pour un grand échantillon) est de -1,64. Puisque la
valeur observée (-10,4) se trouve largement en deçà (queue de
distribution, à gauche), on peut également rejeter l'hypothèse nulle.
Question 5
Le design de la boîte de céréales influe-t-il sur la
satisfaction des consommateurs ? Pour le savoir,
une firme de marketing a distribué deux boites de
céréales de même contenu mais de présentations
différentes (Old et New) à 2500 familles.
Résultat : 830 familles préfèrent Old ; 1220 familles
préfèrent New et 450 familles sont indifférentes.
New est-il « supérieur » à Old ?
Pour vos calculs, ne considérez que les familles
émettant une préférence pour Old ou New.
Question 5
Hypothèse nulle: pas d’effet donc les familles sont
indifférentes entre les deux versions de céréales
(autant de familles choisissent l’un ou l’autre):
H0 : π = 0,5.
Hypothèse alternative: les familles préfèrent la
version New :
H1 : π > 0,5.
Proportion observée de personnes préférant la boite
de céréales New:
P = 0,595 (= 1220 / 2050)
Ecart-type estimé = √P (1 – P) / n
= √(0,595 * 0,405 / 2050) = 0,01083
Question 5
Nous obtenons ensuite la valeur du t
Tc 
P-c
P(1 - P)
n
= (0,595 – 0,50) / 0,01083 = 8,76.
Prob (P > π )= Prob (T > t = 8,76)  0
A nouveau, pour un grand échantillon (n = 2050), on
peut consulter les tables de la loi normale ou de la
loi de Student. On constate ainsi que la probabilité
que Z > 8,76 ou T > 8,76 est très faible et proche de
zéro. Autrement dit, la crédibilité de l'hypothèse
nulle d'indifférence entre les deux emballages est
très faible !
Question 6
On a recueilli deux échantillons d'oeufs pondus dans deux
localités différentes. On répartit ces oeufs selon leurs poids (7
classes) et leur lieu de ponte.
Lieu Poids
(Centres de classe)
Total Moye
nne
s2
2,5
3,5
4,5
5,5
6,5
7,5
8,5
A
3
61
84
196
80
33
0
457
5,35
1,22
B
1
72
88
174
102
46
5
488
5,45
1,47
Le poids des oeufs pondus en A est-il significativement
inférieur au poids des oeufs pondus en B ?
Question 6
Hypothèse nulle est telle que le poids des oeufs pondus en A
et en B sont similaires: H0 : μA - μB = 0.
Hypothèse alternative est que le poids des oeufs pondus en A
est inférieur au poids des oeufs pondus en B:
H1 : μA < μB => μA - μB < 0.
Variances inconnues mais de grands échantillons :
s12 s2 2
(X1  X 2 ) suit une loi normale avec un écart - type de

n1
n2
écart-type = √(1,22 / 457) + (1,47 / 488) = 0,07537
z = (valeur estimée – hypothèse nulle) / écart-type estimé
= [(5,35 – 5,45) – 0] / 0,07537 = -1 ,3267.
La probabilité que Z < -1,32 ou Z > 1,32 s'élève à 0,093, soit
9,3%. Une probabilité critique de plus de 9% (probabilité de
rejeter H0 alors qu’elle est vraie) sera considérée comme
élevée (>5%). On peut donc accepter Ho.
Téléchargement