1 Série statistique double à l’aide d’un exemple Série statistique double: exemple.......................................................................... 2 Série statistique double: questions posées............................................................. 3 Calcul de la covariance sur la base de l'exemple .................................................. 4 Calcul du coefficient de corrélation sur la base de l'exemple............................... 5 La droite des moindres carrés de y en x pour l'exemple ...................................... 6 La prévision ........................................................................................................... 7 Cliquer sur le chapitre désiré Cliquer sur Haut du document pour revenir ici 2 Série statistique double: exemple 1 2 3 4 5 6 i x i 26 27 29 31 32 35 y i 4.5 4.8 4.95 5.1 5.25 5.4 Ce tableau donne pour une société le chiffre des ventes en milliers et le budget de publicité correspondant pour les 6 dernières années notées i de 1à 6. Pour l'année i le budget de publicité est x i ,le chiffre des ventes est y i . Exercice Calculer le chiffre des ventes et le budget de publicité moyen pour les 6 dernières années. 6 6 x ∑ i ∑ yi x = i =1 , y = i =1 6 6 Calculer la variance est l'écart pour les chiffres des ventes et les budgets de publicité pour les 6 dernières années. Dans un repère orthogonal adapté placer les points M ( x i , y i ) avec i = 1,2,3,4,5, 6 et le point M (x, y) appelé " point moyen". Réponse x = 30 y=5 Vocabulaire L'ensemble des points obtenus s'appelle nuage statistique (associé à la statistique double considérée). Haut du document 3 Série statistique double: questions posées On reprend l'exemple précédent: 1 2 3 4 5 6 i x i 26 27 29 31 32 35 y i 4.5 4.8 4.95 5.1 5.25 5.4 Ce tableau donne pour une société le chiffre des ventes en milliers et le budget de publicité en milliers d'euros correspondant pour les 6 dernières années notées i de 1à 6. Pour l'année i le budget de publicité est x i ,le chiffre des ventes est y i . Question 1 Y a t il une corrélation entre le chiffre des ventes et le budget de publicité, comment mesurer cette corrélation? Pour répondre à cette question il faut calculer la covariance et le coefficient de corrélation (voir plus loin). Question 2 Peut-on donner une évaluation du montant des ventes pour un budget de publicité par exemple de 37000 euros? Pour répondre à cette question il faut effectuer un ajustement, par exemple trouver l'équation d'une droite d'ajustement, par exemple: la droite des moindres carrés (voir plus loin) Question 3 L'évaluation effectuée dans la question 2 est-elle valable? Si le coefficient de corrélation est proche de 1 ou de −1 l'évaluation effectuée dans la question précédente est valable, sinon elle ne l'est pas (voir plus loin). Haut du document 4 Calcul de la covariance sur la base de l'exemple ii xy Le tableau suivant est une série statistique double: 26 27 29 31 32 35 4.5 4.8 4.95 5.1 5.25 5.4 Cette série double est la suite des 6 couples ( x i , yi ) pour i = 1,2,3,4,5,6. { ( x1 = 26; y1 = 4.5) , ( x 2 = 27, y 2 = 4.8) , ( x 3 = 29 , y3 = 4.95) , ( x 4 = 31 , y 4 = 5.1) , ( x 5 = 32 , y5 = 5.25 ) , ( x 6 = 35 , y 6 = 5.4) }. Définition de la covariance i =6 ∑ ( x i − x ) × ( y i − y) cov(x , y) = i =1 6 La covariance se calcule plus simplement ainsi i =6 ∑ x i × yi cov(x , y) = i =1 − x×y 6 Exercice Calculer de deux manières la covariance de la série statistique double de l’exemple. Réponse cov(x , y) = 0.875 Haut du document 5 Calcul du coefficient de corrélation sur la base de l'exemple x i 26 27 29 31 32 35 y i 4.5 4.8 4.95 5.1 5.25 5.4 1) On calcule la variance de la série statistique x donnée par : x i 26 27 29 31 32 35 i =6 ∑ V( x ) = i =1 (x i − x) 2 i=6 ∑ xi2 = i =1 − (x) 2 6 6 2) On calcule la variance de la série statistique y donnée par : y i 4.5 4.8 4.95 5.1 5.25 5.4 i =6 ∑ V( y) = i =1 ( y i − y) 2 i =6 ∑ yi 2 = i =1 − ( y) 2 6 6 3) Le coefficient de corrélation entre x et y est : cov(x , y) r ( x , y) = V ( x ) × V ( y) Remarque cov(x , y) r ( x , y) = σx × σY Ecart type de la série statistique x σ x = V( x ) Ecart type de la série statistique y σ y = V ( y) Information très importante Pour une série statistique double on a toujours : cov(x , y) − 1 < r ( x , y) = < +1 σ x × σY Exercice Calculer le coefficient de corrélation de la série double de l’exemple. Réponse r ( x , y) = 0.968 Haut du document 6 La droite des moindres carrés de y en x pour l'exemple La droite des moindres carrés de y en x admet dans le repère dans lequel le nuage statistique a été représenté l’équation : y − y = a ( x − x ). Le coefficient directeur de cette droite ce calcule ainsi : cov(x , y) a= . V( x ) Remarques 1) La droite des moindres carré de y en x passe par le point moyen M ( x , y) 2) La droite des moindres carré de y en x admet pour équation y = ax + b avec : b = y − ax 3) Le coefficient directeur de la droite des moindres carrés de y en x est relié au coefficient de corrélation par : V ( y) a = r ( x , y) V( x ) a = r ( x , y) × σy σx Exercice Donner une équation de la droite des moindres carrés de l’exemple. Réponse a = 0.093 y − 5 = 0.093( x − 30) y = 0.093x + 2.21 Haut du document 7 La prévision On connaît les chiffres des ventes qui correspondent à 6 budgets de publicité, sur la base de ces informations on prévoit le chiffre des ventes pour un budget de publicité hypothétique p en remplaçant x par p dans l’équation de la droite des moindres carrés de y en x et en calculant la valeur de y correspondante. x i 26 27 29 31 32 35 y i 4.5 4.8 4.95 5.1 5.25 5.4 Les calculs effectués ont donné les résultats suivants x = 30 y=5 v( x ) = 9.333 V( y) = 0.0875 cov(x , y) = 0.875 r ( x , y) = 0.968 a = 0.093 y − 5 = 0.093( x − 30) y = 0.093x + 2.21 Une prévision du chiffre des ventes pour un budget de publicité de 37 milliers d’euros est : y = 0.093 × 37 + 2.21 y = 5.651 Le chiffre des ventes prévu pour un budget de publicité de 37 milliers d’euros est : 5.651 milliers d’unités. Cette prévision est valable car le coefficient de corrélation est proche de 1 : r(x, y)= 0.968. Haut du document