Exercices stat desc. bidimensionnelle Exercice 1 : L’observation de la tension systolique T et de l’âge A chez 15 patients de plus de 40 ans fournit la série statistique suivante : Patient A T 1 42 130 2 46 125 3 71 148 4 80 156 5 74 162 6 70 151 7 80 156 8 85 163 9 72 158 10 64 155 11 81 160 12 41 125 13 61 150 14 75 165 15 53 135 1) Calculer la moyenne arithmétique, l’écart-type et la médiane pour chacune des séries unidimensionnelles ci-dessus. 2) Tracer le nuage de points de T en fonction de A. Qu’en pensez-vous ? 3) Calculer la covariance empirique entre ces deux variables ainsi que le coefficient de corrélation linéaire 4) Conclusion 5) Donner l’équation de la droite de régression de T en A. 6) Quel est le pourcentage de variation de Y expliqué par le modèle ? On donne les valeurs suivantes : x y 995 2238 i (x i i x y x )² i 2997,33 ( y i 151067 i y )² 2644,4 Exercice 2 : On cherche à étudier la relation entre le nombre d’enfants d’un couple et son salaire. On dispose des observations suivantes : Nombre d’enfants (X) 4 3 2 1 0 5 6 7 8 Salaire en euros (Y) 510 590 900 1420 2000 600 850 1300 2200 a) Calculer le coefficient de correlation linéaire entre ces deux variables. Conclusion ? b) Un expert en démographie affirme que ces deux caractéristiques sont indépendantes. Qu’en pensezvous ? c) Soit Z=(X-4)². calculer le coefficient de corrélation linéaire entre Y et Z. Quelle relation proposeriez vous afin de prévoir les valeurs de Y en fonction des valeur de Z ? Exercice 3 : Le gérant d’un commerce veut évaluer l’impact des frais déboursés en publicité sur le chiffre d’affaire mensuel de l’entreprise. L’entreprise dépense environ 2000 euros par mois en réclames publicitaires dans un quotidien local et le chiffre d’affaires mensuel est d’environ 225 000 euros. On aimerait évaluer dans quelle mesure une modification dans le budget publicitaire mensuel (X) affecterait le chiffre d’affaire mensuel (Y). On a donc recueilli, sur une période de 10 mois, les données du tableau ci-dessous y i 2300 et x i 21,3 . (ce sont les chiffres en milliers d’euros). On donne de plus : X Y 2,7 220 2,6 280 3,0 250 1,5 170 0,5 150 3,0 340 2,1 310 2,3 210 1,7 180 1,9 190 1 On aimerait savoir si il existe un lien linéaire entre ces deux quantités. 1) Compléter le tableau des calculs préliminaires suivant : X i Yi 594 728 750 255 75 1020 651 X i2 Yi 2 7,29 6,76 9 2,25 0,25 9 4,41 48400 78400 62500 28900 22500 115600 96100 2) Déterminer l’équation de la droite de régression de Y en fonction de X. 3) Soit b le terme constant du modèle. Quelle signification concrète peut-on donner à b ? 4) Quel est, en moyenne, l’impact sur le chiffre d’affaire mensuel pour une augmentation de 1000 euros dans les frais mensuels de publicité ? 5) Quelle serait une bonne estimation du chiffre d’affaires mensuel si on dispose de 3000 euros en frais de publicité ? Exercice 4 : On observe le nombre d’enfants Y sur un ensemble de 12 individus répartis entre les sexes (variable X) : F H 3 10 1) 2) 3) 4) 4 7 5 6 4 3 2 4 5 2 Représenter graphiquement cette série. Calculer les moyennes arithmétiques dans chaque classe Calculer les variances inter et intracatégories. Calculer et interpréter le rapport de corrélation entre X et Y. Exercice 5 : Deux publicités, A et B, sont envisagées pour le lancement d’un nouveau produit . Après avoir visionné ces deux publicités, la direction de l’entreprise émet l’hypothèse qu’elles n’auront pas la même efficacité sur les consommateurs. Afin de confirmer son hypothèse, chaque publicité est testée dans une régiontest. Dans la région où A est diffusée, un sondage auprès de 150 individus indique que 45 d’entre eux se sont procurés le nouveau produit, alors que sur 100 individus de la région où B est diffusée, 35 se sont procurés le nouveau produit. 1) Exprimer les données sous forme d’une table de contingence. 2) Calculer l’indice du Chi2 associé à ce tableau, ainsi que les contributions au Chi2 de chaque case. 3) Est-ce que les résultats de ce sondage permettent de confirmer au seuil 5% l’hypothèse émise par la direction ? (Si Z suit une loi du Chi2 à 1 degré de liberté, P(Z>3,84)=5% 2