Correction Exam Stat 2010

publicité
FASEG - EFASB332 Statistique et probabilité
Août 2010
L'examen dure trois heures (MAXIMUM!). Soyez clairs et concis dans vos réponses, tout en indiquant
correctement les calculs utilisés. Faites attention aux fautes de distraction et de calcul.
1. Une boîte contient 8 billes bleues et 4 billes rouges et une autre boîte, 6 billes bleues et 10 billes
rouges. Une bille tirée au hasard de l'une de ces boites est bleue. Quelle est sa probabilité de provenir
de la première boîte?
2. Il y a deux types de voitures d’occasion. Les bonnes et les mauvaises affaires. Il y a sur le marché
10% de bonnes voitures et 90% de mauvaises voitures. Vous décidez d’acheter une voiture d’occasion.
Comme il est difficile de distinguer les bonnes des mauvaises affaires (au point que le marché puisse
disparaître ! Cf. les travaux de l’économiste Akerlof), vous faites appel à votre ami garagiste qui, par
son expertise, est capable de distinguer une bonne voiture (s’il s’agit d’une bonne) dans 90% des cas,
et une mauvaise voiture (s’il s’agit d’une mauvaise) dans 65% des cas. Une voiture est examinée par
votre ami. Celui-ci conclut que la voiture est mauvaise. Quelle est la probabilité qu'elle soit malgré
tout une bonne voiture ?
3. Un important grossiste en fruits et légumes reçoit des cageots d’abricots en provenance du sud de la
France (délicieux !). La production, comptabilisée en cageots, du cultivateur français avec qui le
grossiste travaille en exclusivité est de 2000 cageots. En moyenne le poids d’un cageot est de 5 kg,
avec un écart-type de 0,1 kg.
(a) Quelle est la probabilité que, dans un échantillon aléatoire de 20 cageots, le poids moyen observé
soit supérieur à 5,2 kg?
(b) Soient 50 échantillons aléatoires. Quel est le nombre d'échantillons pour lesquels le poids moyen
sera compris entre 4,8 et 5,2 kg?
4. Quelle est la probabilité d’obtenir au moins 8 faces au jeu de pile ou face (avec une pièce de
monnaie non truquée) si le nombre de lancements auxquels vous avez droit est égal à 10.
5. La durée de vie (en termes de milliers de kilomètres parcourus) d’un amortisseur de marque Z est
distribuée selon une loi de distribution normale de moyenne 70 et d'écart type 10. Ma voiture est
équipée de quatre amortisseurs Z. Quelle est la probabilité qu'au moins un amortisseur ait une durée de
vie inférieure à 55 ?
6. J’observe les rendements en termes d’hectolitre à l’hectare de deux viticulteurs (en provenance du
même village et dont a priori les terroirs viticoles sont comparables), durant 5 années.
Période Viticulteur 1 Viticulteur 2
1
62
64
2
64
67
3
59
63
4
62
65
5
63
66
a). Calculez un intervalle de confiance à 95% pour la différence de moyennes des rendements de ces
deux viticulteurs. Qu’en concluez-vous ?
b). Refaites la question a). pour un intervalle de confiance à 99%. Quelle conclusion tirez-vous de la
comparaison avec les résultats obtenus en a).
c). Quelles sont les conséquences d’un accroissement du nombre de périodes d’observation ?
d). Expliquez brièvement (trois lignes maximum) quels auraient été les avantages de travailler avec
des échantillons appariés tels que les rendements en termes d’hectolitre à l’hectare pour deux parcelles
d’un même viticulteur.
e). Un inspecteur du Ministère de l’agriculture estime que les rendements de ces deux viticulteurs sont
équivalents. Formulez le test d’hypothèse adéquat et effectuez-le. Qu’en concluez-vous ?
Correction
1. On a :
P(boîte 1)=12/28
P(boîte 2)=16/28
P(bleue| boîte 1)=8/12
P(bleue| boîte 2)=6/12
On cherche P(boîte 1| bleue)
Or la formule par la formule de Bayes on a :
P(boîte 1| bleue)= [P(boîte 1)* P(bleue|boîte 1)]/P(bleue)
et P(bleue)= P(bleue et boîte 1)+ P(bleue et boîte 1)
avec P(bleue et boîte 1)= P(boîte 1)* P(bleue|boîte 1)= 12/28*8/12=8/28
P(bleue et boîte 2)= P(boîte 2)* P(bleue|boîte 2)= 16/28*6/12=6/28
donc P(boîte 1| bleue) = (8/28) / (14/28) = 4/7
2. On a :
P(bonne) = 0.1
P(mauvaise) =0.9
P(« mauvaise » | bonne) = 0.1
P(« mauvaise » | mauvaise) = 0.65
On cherche P(bonne | « mauvaise »)
Or on sait que P(bonne | « mauvaise ») = [P(« mauvaise » | bonne)*P(bonne)]/P(« mauvaise »)
et que P(« mauvaise ») = P (« mauvaise » et mauvaise) + P (« mauvaise » et bonne)
avec P (« mauvaise » et mauvaise) = P(mauvaise)* P(« mauvaise » | mauvaise) = 0.9*0.65=
0.585
P (« mauvaise » et bonne) = P(bonne)* P(« mauvaise » | bonne) = 0.1*0.1= 0.01
donc P(bonne | « mauvaise ») = 0.01/0.595=0.0168
3. On a µ=5 et σ=0.1
On cherche P (X ≥ 5.2). Or X ne suit pas une loi normale centrée réduite et il faut donc réduire
X.
a. On sait que l’écart type de X = σ /√n = 0.1/√20 = 0.0224
Donc P (X ≥ 5.2) = P (Z ≥ (5.2 – 5) / 0.0224) = P (Z ≥ 8.93) ≈ 0 (table de la loi normale
centrée réduite)
b. On cherche P (4.8 ≤ X ≤ 5.2)
Or P (4.8 ≤ X ≤ 5.2) = 1 – P (X ≤ 4.8) – P (X ≥ 5.2)
par symétrie on a que P (X ≤ 4.8) = P (X ≥ 5.2)
et donc P (4.8 ≤ X ≤ 5.2) = 1-2*0= 1
le nombre d’échantillons pour lesquels le poids moyen sera compris entre 4.8 et 5.2 kg est
donc égal à 50.
4. On a P(face) = 0.5 et n=10
On cherche P(s ≥ 8) avec s égal au nombre de face. En utilisant la table de la binomiale on
obtient P(s ≥ 8) = 0.055
5. On cherche P (s ≥ 1) avec s=1 si la durée de vie de l’amortisseur est inférieure à 55 et n=4.
On doit donc commencer par la recherche de P (X≤ 55)
Par symétrie P (X ≤ 55)=P (X ≥ 85) or X n’est pas centrée réduite donc il faut réduire et
P (X ≥ 85) = P ((X-µ)/σ ≥ (85-70)/10)
P(Z ≥ 1,5) = 0,067 = P (s = 1)
(table de la loi normale centrée réduite)
De plus on sait que 1 = P (s ≥ 1) + P (s=0)
 P (s ≥ 1) = 1 – P (s=0)
 1 – (0,933)4 = 0,242
6. a) On a X1 =62 et X2 = 65  (X2 – X1) = 3
On sait que intervalle de confiance à 95% pour un petit échantillon est
µ2 - µ1 = (X2 – X1) ± t025*sp √((1/n1) + (1/n2))
avec sp = √(∑(X1-X1)2+∑(X2-X2)2)/((n1-1)+(n2-1)) = √((4+9+1)+(1+4+4+1))/8 = √24/8 =
1,732
= 3 ± 2,31 * 1,732 * √2/5
= (0,470 ; 5,530)
b) µ2 - µ1 = 3 ± 3,36 * 1,732 * √2/5
= (-0,680 ; 6,680)
On constate qu’un plus grand nombre d’observation est compris dans l’intervalle de confiance
et la marge d’erreur diminue
c) Si on augmente le nombre d’observation, l’écart type de l’échantillon diminue et l’intervalle
de confiance se réduit. On a donc un accroissement de la précision.
d) L’avantage de travailler avec un échantillon apparié est qu’il est possible de maintenir
constant beaucoup de facteurs exogènes. Si on avait comparé les rendements des 2 parcelles
d’un même viticulteur, on aurait exclus toutes les variations dues à l’identité du viticulteur.
e) H0 : X1=X2 ou (X2-X1)=0
H1 : (X2 – X1) > 0
ttest = ((X2-X1)-0/ s ) = 3/ (1,732 * √2/5) = 2.739
On peut rejeter l’hypothèse nulle, que le rendement des 2 agriculteurs est équivalents, à un
niveau de significativité de 10 et, 5% mais pas à un niveau de significativité de 1%.
Téléchargement