Estimation

publicité
3.1
Radio Look
Question 1
La population P est l'ensemble des étudiants de la région grenobloise de taille N (inconnue), la variable X est
la variable indicatrice de l'écoute régulière de la station, leparamètre p est le pourcentage d'étudiants écoutant
régulièrement la station : p =
1
N
N
X
X (i).
i=1
Question 2
30
= 30%
Estimation ponctuelle : p̂ = 100
p
Précision au degré de conance 0,95 : = 1, 96 ∗ 0, 3 ∗ 0, 7/100 = 0, 09 = 9%, d'où l'intervalle [21%; 39%]
Question 3
Il faut diviser la précision par 3, donc multiplier la taille de l'échantillon par 32 = 9. Donc une taille de 900.
Question 4
368
Sur le nouvel échantillon, l'estimation ponctuelle de p est p̂ = 900
= 41%. Comme la nouvelle valeur est plus proche
de 50%, nous n'obtiendrons pas la précision
voulue!
p
La précision obtenue est = 1, 96 ∗ 0, 41 ∗ 0, 59/900 = 0, 032 = 3, 2% ; l'intervalle [37, 8%; 44, 2%]
Question 5
Comme les intervalles de conances ne sont pas disjoints, on ne peut pas armer que l'audience ait augmenté.
3.2
Société ABC
Question 1
Calculons la précision obtenue sur la moyenne hebdomanaire des ventes par magasin au degré de conance de 0,95.
√
= 1, 96 ∗ 360/ 400 = 35, 28
Sur l'ensemble des magasin, nous aurons donc une précision de 25000 ∗ 35, 28 = 882000, l'estimation ponctuelle
étant de 25000 ∗ 800 = 20000000, l'intervalle de conance au degré 0,95 est [19118000; 20882000].
Question 2
Pour obtenir la précision voulue, il faut multiplier la taille de l'échantillon par
882000
200000
2
= 19, 5
soit une taille de 400 ∗ 19, 5 = 7800.
3.3
Une société d'études
Question 1
La précision va être diérente par segment, puisqu'elle dépend de la taille de l'échantillon
(qui ici dépend du
p
segment) et de la valeur du pourcentage qui ici est supposé le même, la valeur sera 1, 96 0, 65 ∗ 0, 35/ni où ni est
la taille du segment i. En se xant un degré de conance de 0,95, on obtient les résultats suivants :
Taille
Précision
Segment 1
540
4%
Segment 2
310
5,3%
1
Segment 3
115
8,7%
Segment 4
430
4,5%
Question 3
Il aurait fallu avoir le même nombre d'individus dans chaque segment, soit 1400/4 = 350, ce qui aurait donné une
précision de 5%.
Question 4
C'est un sondage par la méthode des quotas
3.4
Foire aux vins
Analyse du CA par jour
Estimation
Précision
Intervalle
Avant la foire aux vin
Après la foire aux vins
175 ∗ 1500 =√262500e
1500 ∗ 1, 97 ∗ 46/ 200 = 9612e
[252888 e ; 272112e ]
130 ∗ 2500 =
√325000e
2500 ∗ 1, 97 ∗ 34/ 200 = 11840e
[313160 e ; 336840e ]
Le CA après la foire au vin est supérieur
Analyse du panier
Nbre Articles
Estimation
Précision
Intervalle
CA/client
Estimation
Précision
Intervalle
Avant la foire aux vin
√23
1, 97 ∗ 7/ 200 = 0, 97
[22, 03 ; 23, 97]
Après la foire aux vins
√18
1, 97 ∗ 8/ 200 = 1, 11
[16, 89 ; 19, 11]
Avant la foire aux vin
Après la foire aux vins
175e
√
1, 96 ∗ 46/ 200 = 6, 41e
[168, 59 e ; 181, 41e ]
130e
√
1, 96 ∗ 34/ 200 = 4, 74e
[125, 26 e ; 134, 74e ]
Conclusion
Pendant la foire aux vin, les clients achètent moins mais ils sont plus nombreux.
3.5
La société UVJM
Population, variable paramètre
La population est P = {Comptes clients à soldes > 0}
La variable X associe à un compte son solde
Le paramètre µ =
1
5000
5000
X
X (i) la moyenne des soldes
i=1
Analyse de l'échantillon de 25 comptes
L'estimation ponctuelle de la moyenne est 164,82e, celle de √
l'acart-type 63,73e
La précision qu degré de conance de 0,95 est 2, 06 ∗ 63, 73/ 25 = 26, 25e
L'intervalle de conance pour la moyenne est donc [138, 57 e; 181, 07e ]
Taille nécessaire pour une précision de 8eau degré de conance 0,95
On utilise la loi normale pour calculer cette taille
n=
1, 96 ∗ 63, 73
8
2
2
= 244
Echantillon nal (219+25)=244 comptes
La moyenne des 244 comptes est : 25∗164,82+219∗156,60
= 157, 44e
244
En première approximation on peut approcher la variance estimée par la moyenne pondérée des variances :
25 ∗ 4062, 132 + 219 ∗ 4920, 726
= 4832, 75
244
√
d'où l'écart-type estimé s = 4832, 75 = 69, 5e
Comme l'écart-type a augmenté √
la précision obtenue sera moins bonne que celle prévue. Cette précision au degré de
conance 0,95 est : 1, 96 ∗ 69, 4/ 244 = 8, 71e. D'ou l'intervalle de conance pour la moyenne [149, 63 e; 166,15e ]
L'estimation ponctuelle du montant des créances est 5000 ∗ 157, 44 = 787200e.
L'intervalle de conance [748150 e; 830750 e ].
Calcul exact de la variance : Soient n1 et n2 les tailles des sous échantillons, m1 et m2 les moyennes des sous
échantillons, (xi )1≤i≤n1 les valeurs du premier sous échantillon, (yj )1≤j≤n2 les valeurs du deuxième sous échantillons.
Pour tout m, nous avons :
n1
X
2
(xi − m) =
i=1
2
((xi − m1 ) + (m1 − m)) =
i=1
car le terme rectangle
n2
X
n1
X
Pn1
i=1
n1
X
2
2
(xi − m1 ) + n1 (m1 − m)
i=1
(xi − m1 ) (m1 − m) est nul par dénition de m1 . De même :
2
(yj − m) =
n21
X
2
((yj − m2 ) + (m2 − m)) =
2
(yj − m2 ) + n2 (m2 − m)
2
j=1
j=1
j=1
n2
X
La variance estimée à partir des 244 comptes est (en prenant pour m la moyenne des 244 comptes) :


n2
n1
X
X
1
2
2

(yj − m) 
s2n =
(xi − m) +
n1 + n2 − 1 i=1
j=1
et
s21 =
1
n1 − 1
n1
X
!
2
s22 =
(xi − m1 )
i=1
1
n2 − 1


n2
X
2

(yj − m2 ) 
j=1
l'estimation de la variance est alors :
s2n =
1
2
2
(n1 − 1) s21 + n1 (m1 − m) + (n2 − 1) s22 + n2 (m2 − m)
n1 + n2 − 1
en prenant pour m la moyenne de l'échantillon fusionné. Numériquement nous obtiendrons alors :
s2n = 4842, 17
d'où
s = 69, 59
la diérence avec notre approximation est négligeable.
3.6
La société de contrôle et régulation
Examen de l'information avec la variable X `valeur réelle des référence'
La population P est l'ensemble des références de seonde catégorie.
L'estimateur du montant total dus tock est 1500X n où X n est l'estimateur de la moyenne.
L'estimation ponctuelle
est 1500 × 2304, 1 = 3456150, la précision, au degré de conance 0,95, sur la moyenne
√
est 2 × 753, 74/ 50 = 210, pour la valeur totale du stock : 1500 × 210 = 315000. Sit une précision relative de
315000/3456150 = 9, 1%.
Pour obtenir une précision de 0,5%, soit 16832,5eou 11,22esur la moyenne, il nous faut une taille de n =
2
(1, 96 × 753, 74/11, 22) = 17332 ce qui est 10 fois plus que la taille de la population!!
3
Examen de l'information avec la variable D = X − Y
1. L'estimation ponctuelle de la diérence est 1500×(−11,
73) = −17595. Au degré de conance 0,95,la précision
√
sur la moyene des diérences est 2 × 110, 32/ 50 = 31, 2 , soit sur l'ensemble du stock 1500 × 31, 2 = 46800.
2. La valeur réelle estimé du stock est donc la valeur comptable su stock + cette diérence, soit 336649517595=3348900.
Comme la valeur comptable du stock est connue exactement, la seule imprécision vient de la diérence, la
précision de l'estimation de la valeur du stock réel sera la précison obtenue sur la diérence soit 45735, ce qui
donne une précision relative de 45735/334890 =1,365%
3. Pour obtenir une précision relative de à 0,5%, il faut donc un échantillon de taille n = (1, 96 × 110, 32/11, 22)2 '
371
3.7
S.C.R. Deuxième partie
1. Tout d'abord remarquons que l'écart-type estimé sur le nouvel échantillon est inférieur à celui de l'échantillon
de 50 références, donc la précision voulue sera atteinte.
L'estimation ponctuelle de la valeur réelle
√ totale des stocks est 3366495 − 1500 × 3, 23 = 3361650. La précision
sur la moyenne est de 1.96 × 74, 734/ 371 = 7, 60, soit sur l'ensemble du stock 7, 60 × 1500 = 11400.
L'intervalle de conance au degré de 0,95 est donc : [3350250 ; 3373050].
Pour tout le stock nous avons les résultats suivants :
• Estimation ponctuelle : 228660 + 3361650 + 612750 = 4203060
• La précision obtenue est 4540 + 11400 + 0 = 15940 avec un degré de conance inconnu.
2. Peut-être pas car la valeur 0 à une fréquence trop importante et il y a surement plus d'erreur de sens négatif
que positif.
3. En prenant un degré de conance de 0,95, la précision obtenue est de = 1, 96 ×
L'intervalle de conance associé [10, 5% ; 17, 5%]
4
p
0, 14 (0, 86) /371 = 0, 035.
Téléchargement