Novembre 2013 Solutionnaire : TP3 de Statistiques et Probabilités

publicité
Novembre 2013
Solutionnaire :
TP3 de Statistiques et Probabilités
Exercice 1
De manière aléatoire, on a tiré un petit échantillon de 10 cotes provenant d'un concours
national en calcul statistique. Ces cotes sont les suivantes :
71
74
65
72
64
63
62
62
60
80
(a) Calculez la moyenne et l'écart-type de cet échantillon.
(b) Construisez un intervalle de confiance (95%) pour la moyenne des cotes du concours
national.
Solution :
(a) Moyenne de l'échantillon = ∑ Xi / n = 673 / 10 = 67,3.
La cote moyenne est de 67,3 points.
Calculons tout d'abord la variance de l'échantillon en appliquant la formule suivante
(attention : tenez compte du fait qu'il s'agit d'un petit échantillon de sorte que le nombre de
degrés de liberté est de n-1 = 9) :
Variance = s2 = ∑ (Xi – X)2 / n-1 = 386,1 / 9 = 42,9
Ecart-type = s = 6,55.
(b) L'intervalle de confiance d'une population pour laquelle la variance exacte (σ) est inconnue
est déterminé à l'aide de l'écart-type de l'échantillon (s) et de la distribution du t de
Student. Ainsi,
μ = X ± t.025 s / √n
μ Є (67,3 ± 2,26 * 6,55 /√10)
μ Є (67,3 ± 4,68)
Exercice 2
Le propriétaire d'un élevage de poulets s'intéresse au poids moyen des animaux prêts à la
vente issus de son établissement. Il a tiré au hasard un échantillon de 8 poulets prêts à la
vente. La pesée a donné les résultats suivants (poids exprimés en grammes) :
900
887
995
1015
1037
754
955
1086
1
Novembre 2013
(a) Calculez la moyenne et l'écart-type de cet échantillon.
(b) Construisez un intervalle de confiance (95%) pour la moyenne des animaux prêts à la
vente.
Solution :
(a) Moyenne de l'échantillon = ∑ Xi / n = 7629 / 8 = 953,6.
Le poids moyen des poulets prêts à la vente et repris dans l'échantillon est de 953,6
grammes.
Calculons tout d'abord la variance de l'échantillon en appliquant la formule suivante
(attention : tenez compte du fait qu'il s'agit d'un petit échantillon de sorte que le nombre de
degrés de liberté est de n-1 = 7) :
Variance = s2 = ∑ (Xi – X)2 / n-1 = 77119,87 / 7 = 11017,12
Ecart-type = s = 105,0.
(b) L'intervalle de confiance d'une population pour laquelle la variance exacte (σ) est inconnue
est déterminé à l'aide de l'écart-type de l'échantillon (s) et de la distribution du t de
Student. Ainsi,
μ = X ± t.025 s / √n
μ Є (953,6 ± 2,36 * 105 /√8)
μ Є (953,6 ± 87,61)
Exercice 3
Considérons deux échantillons indépendants d'hommes et de femmes dont on observe le
salaire hebdomadaire (en milliers de francs) :
Hommes
Femmes
12
9
11
12
19
8
16
10
22
16
Calculez un intervalle de confiance (95%) pour la différence entre la moyenne des salaires
hebdomadaires des hommes et celle des salaires hebdomadaires des femmes de la population.
2
Novembre 2013
Solution :
(a) Calculons dans un premier temps la moyenne des salaires obtenus par les hommes ainsi que
la moyenne des salaires obtenus par les femmes.
Moyenne de l'échantillon pour les hommes = ∑ XiH / n = 80 / 5 = 16.
Moyenne de l'échantillon pour les femmes = ∑ XiF / n = 55 / 5 = 11.
Déterminons ensuite la variance de chacun des échantillons en appliquant toujours la même
formule (attention : tenez compte du fait qu'il s'agit d'un petit échantillon de sorte que le
nombre de degrés de liberté est de n-1 = 4) :
Variance pour les hommes = sH2 = ∑ (XiH – XH)2 / n-1 = 86 / 4 = 21,5.
Ecart-type pour les hommes = sH = 4,64.
Variance pour les femmes = sF2 = ∑ (XiF – XF)2 / n-1 = 40 / 4 = 10.
Ecart-type pour les femmes = sF = 3,16.
Puisque nous recherchons un intervalle de confiance pour la différence entre la moyenne des
salaires perçus d'une part, par les hommes et d'autre part, par les femmes, nous allons devoir
appliquer la formule suivante :
μH - μF = ( XH - XF) ± t.025 sp / √(1/nH + 1/nF)
où la variance commune est estimée comme suit :
sp2 = {∑ (XiH – XH)2 + ∑ (XiF – XF)2} / {(nH - 1) + (nF – 1)}
sp2 = (86 + 40) / (4 + 4) = 15,75
Ecart-type commun = 3,97
L'intervalle de confiance à 95% est déterminé en utilisant la table de la loi de Student pour 8
degrés de liberté :
μH - μF Є ((16 - 11) ± 2,31 * 3,97 /√(1/5) + (1/5))
μH - μF Є (5 ± 5,78)
3
Novembre 2013
Exercice 4
Un juge américain de la ville de Boston a, au cours de sa carrière, désigné 700 personnes
faisant partie de la population de la ville pour être jurés lors de ses procès. 15% de ces
personnes étaient des femmes. Or, la ville de Boston compte 29% de femmes éligibles à cette
fonction.
(a) Si π désigne la probabilité qu'un juré choisi par le juge soit une femme, comment doit être
libellé H0 pour tester l'impartialité du juge dans son choix quant au sexe ?
(b) Calculez la probabilité critique (p.c.) unilatérale pour H0 ?
(c) Au seuil de α = 5%, peut-on rejeter H0 ?
Solution :
(a) Puisqu'il y a 29% de femmes éligibles à la fonction de juré dans la ville de Boston,
l'hypothèse nulle d'impartialité de choix du juge doit donc être : H0 : π = 0,29.
(b) Ce que l'on souhaite à présent évaluer est la crédibilité de l'hypothèse nulle posée cidessus. Pour cela, nous allons utiliser la table de la loi de Student pour les petits échantillons
et tentez d'estimer la valeur du t, selon le principe suivant :
t = (valeur estimée – hypothèse nulle) / écart-type estimé
avec l'écart-type estimé dans le cadre des proportions étant défini comme suit :
Ecart-type estimé = √P (1 – P) / n
Dans le cas présent, nous obtenons donc
Ecart-type estimé = √(0,15 * 0,85 / 700) = 0,01349
Par conséquent, nous obtenons la valeur du t = (0,15 – 0,29) / 0,01349 = -10,4.
Pour un grand échantillon (n = 700), on peut consulter les tables de la loi normale ou de la loi
de Student. On constate ainsi que la probabilité que Z > 10,4 ou t > 10,4 est très faible et
proche de zéro. Autrement dit, la crédibilité de l'hypothèse nulle d'impartialité du juge est
très faible !
(c) Par symétrie, on observe que la valeur critique du t de Student pour un seuil de 5% (pour
un grand échantillon) est de -1,64. Puisque la valeur observée se trouve largement en deçà
(queue de distribution, à gauche), on peut également rejeter l'hypothèse nulle.
4
Novembre 2013
Exercice 5
Le design de la boîte de céréales influe-t-il sur la satisfaction des consommateurs ? Pour le
savoir, une firme de marketing a distribué deux boites de céréales de même contenu mais de
présentations différentes (Old et New) à 2500 familles.
Résultat : 830 familles préfèrent Old ; 1220 familles préfèrent New et 450 familles sont
indifférentes.
New est-il « supérieur » à Old ?
Pour vos calculs, ne considérez que les familles émettant une préférence pour Old ou New.
Solution :
Nous pouvons formaliser le problème sous la forme d'un test d'hypothèses. Posons ainsi que
l'hypothèse nulle est telle que les familles sont indifférentes entre les deux versions de
céréales. Soit H0 : π = 0,5. L'hypothèse alternative est que les familles préfèrent la version
New : H1 : π > 0,5.
La proportion observée de personnes préférant la boite de céréales New est donnée par P =
0,595 (= 1220 / 2050) de sorte que nous pouvons évalué l'écart-type estimé, soit
Ecart-type estimé = √P (1 – P) / n = √(0,595 * 0,405 / 2050) = 0,01083
Nous obtenons ensuite la valeur du t = (valeur estimée – hypothèse nulle) / écart-type estimé
= (0,595 – 0,50) / 0,01083 = 8,76.
A nouveau, pour un grand échantillon (n = 2050), on peut consulter les tables de la loi normale
ou de la loi de Student. On constate ainsi que la probabilité que Z > 8,76 ou t > 8,76 est très
faible et proche de zéro. Autrement dit, la crédibilité de l'hypothèse nulle d'indifférence
entre les deux emballages est très faible !
Exercice 6
On a recueilli deux échantillons d'oeufs pondus dans deux localités différentes. On répartit
ces oeufs selon leurs poids (7 classes) et leur lieu de ponte.
Lieu
Poids
(Centres de classe)
Total
Moyenne
s2
2,5
3,5
4,5
5,5
6,5
7,5
8,5
A
3
61
84
196
80
33
0
457
5,35
1,22
B
1
72
88
174
102
46
5
488
5,45
1,47
Le poids des oeufs pondus en A est-il significativement inférieur au poids des oeufs pondus en
B?
5
Novembre 2013
Solution :
Nous pouvons formaliser le problème sous la forme d'un test d'hypothèses. Posons ainsi que
l'hypothèse nulle est telle que le poids des oeufs pondus en A et en B sont similaires. Soit
H0 : μA - μB = 0. L'hypothèse alternative est que le poids des oeufs pondus en A est inférieur
au poids des oeufs pondus en B, soit H1 : μA - μB < 0.
L'écart-type estimé est ici donné par √(1,22 / 457) + (1,47 / 488) = 0,07537
Nous obtenons ensuite la valeur du t = (valeur estimée – hypothèse nulle) / écart-type estimé
= (5,35 – 5,45) / 0,07537 = -1 ,3267.
A nouveau, pour un grand échantillon, on peut consulter les tables de la loi normale ou de la loi
de Student. On constate ainsi que la probabilité que Z < -1,32 ou Z > 1,32 s'élève à 0,093, soit
9,3%. Une probabilité critique de plus de 9% sera considérée par certains comme élevée de
sorte que l'hypothèse nulle n'est pas sans crédibilité. On peut donc accepter Ho.
6
Téléchargement