Série statistique double:exemple

publicité
1
Série statistique double à l’aide d’un exemple
Série statistique double: exemple .......................................................................... 2
Série statistique double: questions posées............................................................. 3
Calcul de la covariance sur la base de l'exemple .................................................. 4
Calcul du coefficient de corrélation sur la base de l'exemple ............................... 5
La droite des moindres carrés de y en x pour l'exemple ...................................... 6
La prévision ........................................................................................................... 7
Cliquer sur le chapitre désiré
Cliquer sur Haut du document pour revenir ici
2
Série statistique double: exemple
1
2
3
4
5
6
i
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
Ce tableau donne pour une société le chiffre des ventes en milliers et le budget
de publicité correspondant pour les 6 dernières années notées i de 1à 6.
Pour l'année i le budget de publicité est x i ,le chiffre des ventes est y i .
Exercice
Calculer le chiffre des ventes et le budget de publicité moyen pour les 6
dernières années.
6
6
x
 i
 yi
x  i 1 , y  i 1
6
6
Calculer la variance est l'écart pour les chiffres des ventes et les budgets de
publicité pour les 6 dernières années.
Dans un repère orthogonal adapté placer les points
M ( x i , yi ) avec i  1,2,3,4,5, 6
et le point M (x, y) appelé " point moyen".
Réponse
x  30
y5
Vocabulaire
L'ensemble des points obtenus s'appelle nuage statistique (associé à la statistique
double considérée).
Haut du document
3
Série statistique double: questions posées
On reprend l'exemple précédent:
1
2
3
4
5
6
i
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
Ce tableau donne pour une société le chiffre des ventes en milliers et le budget
de publicité en milliers d'euros correspondant pour les 6 dernières années notées
i de 1à 6.
Pour l'année i le budget de publicité est x i ,le chiffre des ventes est y i .
Question 1
Y a t il une corrélation entre le chiffre des ventes et le budget de publicité,
comment mesurer cette corrélation?
Pour répondre à cette question il faut calculer la covariance et le coefficient de
corrélation (voir plus loin).
Question 2
Peut-on donner une évaluation du montant des ventes pour un budget de
publicité par exemple de 37000 euros?
Pour répondre à cette question il faut effectuer un ajustement, par exemple
trouver l'équation d'une droite d'ajustement, par exemple: la droite des
moindres carrés (voir plus loin)
Question 3
L'évaluation effectuée dans la question 2 est-elle valable?
Si le coefficient de corrélation est proche de 1 ou de 1 l'évaluation effectuée
dans la question précédente est valable, sinon elle ne l'est pas (voir plus loin).
Haut du document
4
Calcul de la covariance sur la base de l'exemple
Le tableau suivant est une série statistique double:
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
Cette série double est la suite des 6 couples
 x i , yi  pour i  1,2,3,4,5,6.
  x1  26; y1  4.5 ,  x 2  27, y 2  4.8 ,  x 3  29 , y3  4.95 ,
 x 4  31 , y 4  5.1 ,  x 5  32 , y5  5.25  ,  x 6  35 , y6  5.4 .
Définition de la covariance
i 6
 ( x i  x )  ( y i  y)
cov(x, y)  i 1
6
La covariance se calcule plus simplement ainsi
i 6
 x i  yi
cov(x, y)  i 1
xy
6
Exercice
Calculer de deux manières la covariance de la série statistique double de
l’exemple.
Réponse
cov(x, y)  0.875
Haut du document
5
Calcul du coefficient de corrélation sur la base de l'exemple
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
1) On calcule la variance de la série statistique x donnée par :
x i 26 27 29 31 32 35
i 6

V( x )  i 1
(x i  x) 2
i 6

xi2
 i 1
 (x) 2
6
6
2) On calcule la variance de la série statistique y donnée par :
y i 4.5 4.8 4.95 5.1 5.25 5.4
i 6

V( y)  i 1
( y i  y) 2
i 6

yi 2
 i 1
 ( y) 2
6
6
3) Le coefficient de corrélation entre x et y est :
cov(x, y)
r ( x , y) 
V ( x )  V ( y)
Remarque
cov(x, y)
r ( x , y) 
 x  Y
Ecart type de la série statistique x
 x  V(x)
Ecart type de la série statistique y
 y  V ( y)
Information très importante
Pour une série statistique double on a toujours :
cov(x, y)
 1  r ( x , y) 
 1
 x  Y
Exercice Calculer le coefficient de corrélation de la série double de l’exemple.
Réponse
r ( x, y)  0.968
Haut du document
6
La droite des moindres carrés de y en x pour l'exemple
La droite des moindres carrés de y en x admet dans le repère dans lequel le
nuage statistique a été représenté l’équation :
y  y  a ( x  x ).
Le coefficient directeur de cette droite ce calcule ainsi :
cov(x, y)
a
.
V( x )
Remarques
1) La droite des moindres carré de y en x passe par le point moyen
M ( x , y)
2) La droite des moindres carré de y en x admet pour équation
y  ax  b
avec : b  y  ax
3) Le coefficient directeur de la droite des moindres carrés de y en x est relié au
coefficient de corrélation par :
V ( y)
a  r ( x , y)
V( x )
a  r ( x , y) 
y
x
Exercice
Donner une équation de la droite des moindres carrés de l’exemple.
Réponse
a  0.093
y  5  0.093( x  30)
y  0.093x  2.21
Haut du document
7
La prévision
On connaît les chiffres des ventes qui correspondent à 6 budgets de publicité,
sur la base de ces informations on prévoit le chiffre des ventes pour un budget
de publicité hypothétique p en remplaçant x par p dans l’équation de la droite
des moindres carrés de y en x et en calculant la valeur de y correspondante.
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
Les calculs effectués ont donné les résultats suivants
x  30
y5
v( x )  9.333
V( y)  0.0875
cov(x , y)  0.875
r ( x , y)  0.968
a  0.093
y  5  0.093( x  30)
y  0.093 x  2.21
Une prévision du chiffre des ventes pour un budget de publicité de 37 milliers
d’euros est :
y  0.093  37  2.21
y  5.651
Le chiffre des ventes prévu pour un budget de publicité de 37 milliers d’euros
est : 5.651 milliers d’unités.
Cette prévision est valable car le coefficient de corrélation est proche de 1 :
r(x, y)= 0.968.
Haut du document
Téléchargement