TP3 complément 2

publicité
Exercices stat desc. bidimensionnelle
Exercice 1 : L’observation de la tension systolique T et de l’âge A chez 15 patients de plus de 40 ans fournit la
série statistique suivante :
Patient
A
T
1
42
130
2
46
125
3
71
148
4
80
156
5
74
162
6
70
151
7
80
156
8
85
163
9
72
158
10
64
155
11
81
160
12
41
125
13
61
150
14
75
165
15
53
135
1) Calculer la moyenne arithmétique, l’écart-type et la médiane pour chacune des séries
unidimensionnelles ci-dessus.
2) Tracer le nuage de points de T en fonction de A. Qu’en pensez-vous ?
3) Calculer la covariance empirique entre ces deux variables ainsi que le coefficient de corrélation linéaire
4) Conclusion
5) Donner l’équation de la droite de régression de T en A.
6) Quel est le pourcentage de variation de Y expliqué par le modèle ?
On donne les valeurs suivantes :
x
y
995
2238
i
(x
i
i
x y
 x )²
i
2997,33
( y
i
151067
i
 y )²
2644,4
Exercice 2 : On cherche à étudier la relation entre le nombre d’enfants d’un couple et son salaire. On dispose des
observations suivantes :
Nombre d’enfants (X)
4
3
2
1
0
5
6
7
8
Salaire en euros (Y)
510
590
900
1420
2000
600
850
1300
2200
a) Calculer le coefficient de correlation linéaire entre ces deux variables. Conclusion ?
b) Un expert en démographie affirme que ces deux caractéristiques sont indépendantes. Qu’en pensezvous ?
c) Soit Z=(X-4)². calculer le coefficient de corrélation linéaire entre Y et Z. Quelle relation proposeriez
vous afin de prévoir les valeurs de Y en fonction des valeur de Z ?
Exercice 3 : Le gérant d’un commerce veut évaluer l’impact des frais déboursés en publicité sur le chiffre
d’affaire mensuel de l’entreprise. L’entreprise dépense environ 2000 euros par mois en réclames publicitaires
dans un quotidien local et le chiffre d’affaires mensuel est d’environ 225 000 euros.
On aimerait évaluer dans quelle mesure une modification dans le budget publicitaire mensuel (X) affecterait le
chiffre d’affaire mensuel (Y). On a donc recueilli, sur une période de 10 mois, les données du tableau ci-dessous
y i  2300 et
x i  21,3 .
(ce sont les chiffres en milliers d’euros). On donne de plus :


X
Y
2,7
220
2,6
280
3,0
250
1,5
170
0,5
150
3,0
340
2,1
310
2,3
210
1,7
180
1,9
190
1
On aimerait savoir si il existe un lien linéaire entre ces deux quantités.
1) Compléter le tableau des calculs préliminaires suivant :
X i Yi
594
728
750
255
75
1020
651
X i2
Yi 2
7,29
6,76
9
2,25
0,25
9
4,41
48400
78400
62500
28900
22500
115600
96100
2) Déterminer l’équation de la droite de régression de Y en fonction de X.
3) Soit b le terme constant du modèle. Quelle signification concrète peut-on donner à b ?
4) Quel est, en moyenne, l’impact sur le chiffre d’affaire mensuel pour une augmentation de 1000 euros
dans les frais mensuels de publicité ?
5) Quelle serait une bonne estimation du chiffre d’affaires mensuel si on dispose de 3000 euros en frais de
publicité ?
Exercice 4 : On observe le nombre d’enfants Y sur un ensemble de 12 individus répartis entre les sexes (variable
X) :
F
H
3
10
1)
2)
3)
4)
4
7
5
6
4
3
2
4
5
2
Représenter graphiquement cette série.
Calculer les moyennes arithmétiques dans chaque classe
Calculer les variances inter et intracatégories.
Calculer et interpréter le rapport de corrélation entre X et Y.
Exercice 5 : Deux publicités, A et B, sont envisagées pour le lancement d’un nouveau produit . Après avoir
visionné ces deux publicités, la direction de l’entreprise émet l’hypothèse qu’elles n’auront pas la même
efficacité sur les consommateurs. Afin de confirmer son hypothèse, chaque publicité est testée dans une régiontest. Dans la région où A est diffusée, un sondage auprès de 150 individus indique que 45 d’entre eux se sont
procurés le nouveau produit, alors que sur 100 individus de la région où B est diffusée, 35 se sont procurés le
nouveau produit.
1)
Exprimer les données sous forme d’une table de contingence.
2)
Calculer l’indice du Chi2 associé à ce tableau, ainsi que les contributions au Chi2 de chaque case.
3)
Est-ce que les résultats de ce sondage permettent de confirmer au seuil 5% l’hypothèse émise par la
direction ? (Si Z suit une loi du Chi2 à 1 degré de liberté, P(Z>3,84)=5%
2
Téléchargement