1
Exercices stat desc. bidimensionnelle
Exercice 1 : L’observation de la tension systolique T et de l’âge A chez 15 patients de plus de 40 ans fournit la
série statistique suivante :
Patient
1
2
3
4
5
6
7
9
10
11
12
13
14
15
A
42
46
71
80
74
70
80
72
64
81
41
61
75
53
T
130
125
148
156
162
151
156
158
155
160
125
150
165
135
1) Calculer la moyenne arithmétique, l’écart-type et la médiane pour chacune des séries
unidimensionnelles ci-dessus.
2) Tracer le nuage de points de T en fonction de A. Qu’en pensez-vous ?
3) Calculer la covariance empirique entre ces deux variables ainsi que le coefficient de corrélation linéaire
4) Conclusion
5) Donner l’équation de la droite de régression de T en A.
6) Quel est le pourcentage de variation de Y expliqué par le modèle ?
On donne les valeurs suivantes :
i
x
i
y
(xxi
ii yx
(yyi
995
2238
2997,33
151067
2644,4
Exercice 2 : On cherche à étudier la relation entre le nombre d’enfants d’un couple et son salaire. On dispose des
observations suivantes :
Salaire en euros (Y)
Nombre d’enfants (X)
510
4
590
3
900
2
1420
1
2000
0
600
5
850
6
1300
7
2200
8
a) Calculer le coefficient de correlation linéaire entre ces deux variables. Conclusion ?
b) Un expert en démographie affirme que ces deux caractéristiques sont indépendantes. Qu’en pensez-
vous ?
c) Soit Z=(X-4)². calculer le coefficient de corrélation linéaire entre Y et Z. Quelle relation proposeriez
vous afin de prévoir les valeurs de Y en fonction des valeur de Z ?
Exercice 3 : Le gérant d’un commerce veut évaluer l’impact des frais déboursés en publicité sur le chiffre
d’affaire mensuel de l’entreprise. L’entreprise dépense environ 2000 euros par mois en réclames publicitaires
dans un quotidien local et le chiffre d’affaires mensuel est d’environ 225 000 euros.
On aimerait évaluer dans quelle mesure une modification dans le budget publicitaire mensuel (X) affecterait le
chiffre d’affaire mensuel (Y). On a donc recueilli, sur une période de 10 mois, les données du tableau ci-dessous
(ce sont les chiffres en milliers d’euros). On donne de plus :
2300
i
y
et
3,12
i
x
.
X
2,7
2,6
3,0
1,5
0,5
3,0
2,1
2,3
1,7
1,9
Y
220
280
250
170
150
340
310
210
180
190
2
On aimerait savoir si il existe un lien linéaire entre ces deux quantités.
1) Compléter le tableau des calculs préliminaires suivant :
iiYX
594
728
750
255
75
1020
651
2
i
X
7,29
6,76
9
2,25
0,25
9
4,41
2
i
Y
48400
78400
62500
28900
22500
115600
96100
2) Déterminer l’équation de la droite de régression de Y en fonction de X.
3) Soit b le terme constant du modèle. Quelle signification concrète peut-on donner à b ?
4) Quel est, en moyenne, l’impact sur le chiffre d’affaire mensuel pour une augmentation de 1000 euros
dans les frais mensuels de publicité ?
5) Quelle serait une bonne estimation du chiffre d’affaires mensuel si on dispose de 3000 euros en frais de
publicité ?
Exercice 4 : On observe le nombre d’enfants Y sur un ensemble de 12 individus répartis entre les sexes (variable
X) :
F
3
4
5
4
2
5
H
10
7
6
3
4
2
1) Représenter graphiquement cette série.
2) Calculer les moyennes arithmétiques dans chaque classe
3) Calculer les variances inter et intracatégories.
4) Calculer et interpréter le rapport de corrélation entre X et Y.
Exercice 5 : Deux publicités, A et B, sont envisagées pour le lancement d’un nouveau produit . Après avoir
visionné ces deux publicités, la direction de l’entreprise émet l’hypothèse qu’elles n’auront pas la même
efficacité sur les consommateurs. Afin de confirmer son hypothèse, chaque publicité est testée dans une région-
test. Dans la région où A est diffusée, un sondage auprès de 150 individus indique que 45 d’entre eux se sont
procurés le nouveau produit, alors que sur 100 individus de la région où B est diffusée, 35 se sont procurés le
nouveau produit.
1) Exprimer les données sous forme d’une table de contingence.
2) Calculer l’indice du Chi2 associé à ce tableau, ainsi que les contributions au Chi2 de chaque case.
3) Est-ce que les résultats de ce sondage permettent de confirmer au seuil 5% l’hypothèse émise par la
direction ? (Si Z suit une loi du Chi2 à 1 degré de liberté, P(Z>3,84)=5%
1 / 2 100%