1 Série statistique double à l’aide d’un exemple Série statistique double: exemple .......................................................................... 2 Série statistique double: questions posées............................................................. 3 Calcul de la covariance sur la base de l'exemple .................................................. 4 Calcul du coefficient de corrélation sur la base de l'exemple ............................... 5 La droite des moindres carrés de y en x pour l'exemple ...................................... 6 La prévision ........................................................................................................... 7 Cliquer sur le chapitre désiré Cliquer sur Haut du document pour revenir ici 2 Série statistique double: exemple 1 2 3 4 5 6 i x i 26 27 29 31 32 35 y i 4.5 4.8 4.95 5.1 5.25 5.4 Ce tableau donne pour une société le chiffre des ventes en milliers et le budget de publicité correspondant pour les 6 dernières années notées i de 1à 6. Pour l'année i le budget de publicité est x i ,le chiffre des ventes est y i . Exercice Calculer le chiffre des ventes et le budget de publicité moyen pour les 6 dernières années. 6 6 x i yi x i 1 , y i 1 6 6 Calculer la variance est l'écart pour les chiffres des ventes et les budgets de publicité pour les 6 dernières années. Dans un repère orthogonal adapté placer les points M ( x i , yi ) avec i 1,2,3,4,5, 6 et le point M (x, y) appelé " point moyen". Réponse x 30 y5 Vocabulaire L'ensemble des points obtenus s'appelle nuage statistique (associé à la statistique double considérée). Haut du document 3 Série statistique double: questions posées On reprend l'exemple précédent: 1 2 3 4 5 6 i x i 26 27 29 31 32 35 y i 4.5 4.8 4.95 5.1 5.25 5.4 Ce tableau donne pour une société le chiffre des ventes en milliers et le budget de publicité en milliers d'euros correspondant pour les 6 dernières années notées i de 1à 6. Pour l'année i le budget de publicité est x i ,le chiffre des ventes est y i . Question 1 Y a t il une corrélation entre le chiffre des ventes et le budget de publicité, comment mesurer cette corrélation? Pour répondre à cette question il faut calculer la covariance et le coefficient de corrélation (voir plus loin). Question 2 Peut-on donner une évaluation du montant des ventes pour un budget de publicité par exemple de 37000 euros? Pour répondre à cette question il faut effectuer un ajustement, par exemple trouver l'équation d'une droite d'ajustement, par exemple: la droite des moindres carrés (voir plus loin) Question 3 L'évaluation effectuée dans la question 2 est-elle valable? Si le coefficient de corrélation est proche de 1 ou de 1 l'évaluation effectuée dans la question précédente est valable, sinon elle ne l'est pas (voir plus loin). Haut du document 4 Calcul de la covariance sur la base de l'exemple Le tableau suivant est une série statistique double: x i 26 27 29 31 32 35 y i 4.5 4.8 4.95 5.1 5.25 5.4 Cette série double est la suite des 6 couples x i , yi pour i 1,2,3,4,5,6. x1 26; y1 4.5 , x 2 27, y 2 4.8 , x 3 29 , y3 4.95 , x 4 31 , y 4 5.1 , x 5 32 , y5 5.25 , x 6 35 , y6 5.4 . Définition de la covariance i 6 ( x i x ) ( y i y) cov(x, y) i 1 6 La covariance se calcule plus simplement ainsi i 6 x i yi cov(x, y) i 1 xy 6 Exercice Calculer de deux manières la covariance de la série statistique double de l’exemple. Réponse cov(x, y) 0.875 Haut du document 5 Calcul du coefficient de corrélation sur la base de l'exemple x i 26 27 29 31 32 35 y i 4.5 4.8 4.95 5.1 5.25 5.4 1) On calcule la variance de la série statistique x donnée par : x i 26 27 29 31 32 35 i 6 V( x ) i 1 (x i x) 2 i 6 xi2 i 1 (x) 2 6 6 2) On calcule la variance de la série statistique y donnée par : y i 4.5 4.8 4.95 5.1 5.25 5.4 i 6 V( y) i 1 ( y i y) 2 i 6 yi 2 i 1 ( y) 2 6 6 3) Le coefficient de corrélation entre x et y est : cov(x, y) r ( x , y) V ( x ) V ( y) Remarque cov(x, y) r ( x , y) x Y Ecart type de la série statistique x x V(x) Ecart type de la série statistique y y V ( y) Information très importante Pour une série statistique double on a toujours : cov(x, y) 1 r ( x , y) 1 x Y Exercice Calculer le coefficient de corrélation de la série double de l’exemple. Réponse r ( x, y) 0.968 Haut du document 6 La droite des moindres carrés de y en x pour l'exemple La droite des moindres carrés de y en x admet dans le repère dans lequel le nuage statistique a été représenté l’équation : y y a ( x x ). Le coefficient directeur de cette droite ce calcule ainsi : cov(x, y) a . V( x ) Remarques 1) La droite des moindres carré de y en x passe par le point moyen M ( x , y) 2) La droite des moindres carré de y en x admet pour équation y ax b avec : b y ax 3) Le coefficient directeur de la droite des moindres carrés de y en x est relié au coefficient de corrélation par : V ( y) a r ( x , y) V( x ) a r ( x , y) y x Exercice Donner une équation de la droite des moindres carrés de l’exemple. Réponse a 0.093 y 5 0.093( x 30) y 0.093x 2.21 Haut du document 7 La prévision On connaît les chiffres des ventes qui correspondent à 6 budgets de publicité, sur la base de ces informations on prévoit le chiffre des ventes pour un budget de publicité hypothétique p en remplaçant x par p dans l’équation de la droite des moindres carrés de y en x et en calculant la valeur de y correspondante. x i 26 27 29 31 32 35 y i 4.5 4.8 4.95 5.1 5.25 5.4 Les calculs effectués ont donné les résultats suivants x 30 y5 v( x ) 9.333 V( y) 0.0875 cov(x , y) 0.875 r ( x , y) 0.968 a 0.093 y 5 0.093( x 30) y 0.093 x 2.21 Une prévision du chiffre des ventes pour un budget de publicité de 37 milliers d’euros est : y 0.093 37 2.21 y 5.651 Le chiffre des ventes prévu pour un budget de publicité de 37 milliers d’euros est : 5.651 milliers d’unités. Cette prévision est valable car le coefficient de corrélation est proche de 1 : r(x, y)= 0.968. Haut du document