Série statistique double à l`aide d`un exemple

publicité
1
Série statistique double à l’aide d’un exemple
Série statistique double: exemple.......................................................................... 2
Série statistique double: questions posées............................................................. 3
Calcul de la covariance sur la base de l'exemple .................................................. 4
Calcul du coefficient de corrélation sur la base de l'exemple............................... 5
La droite des moindres carrés de y en x pour l'exemple ...................................... 6
La prévision ........................................................................................................... 7
Cliquer sur le chapitre désiré
Cliquer sur Haut du document pour revenir ici
2
Série statistique double: exemple
1
2
3
4
5
6
i
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
Ce tableau donne pour une société le chiffre des ventes en milliers et le budget
de publicité correspondant pour les 6 dernières années notées i de 1à 6.
Pour l'année i le budget de publicité est x i ,le chiffre des ventes est y i .
Exercice
Calculer le chiffre des ventes et le budget de publicité moyen pour les 6
dernières années.
6
6
x
∑ i
∑ yi
x = i =1 , y = i =1
6
6
Calculer la variance est l'écart pour les chiffres des ventes et les budgets de
publicité pour les 6 dernières années.
Dans un repère orthogonal adapté placer les points
M ( x i , y i ) avec i = 1,2,3,4,5, 6
et le point M (x, y) appelé " point moyen".
Réponse
x = 30
y=5
Vocabulaire
L'ensemble des points obtenus s'appelle nuage statistique (associé à la statistique
double considérée).
Haut du document
3
Série statistique double: questions posées
On reprend l'exemple précédent:
1
2
3
4
5
6
i
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
Ce tableau donne pour une société le chiffre des ventes en milliers et le budget
de publicité en milliers d'euros correspondant pour les 6 dernières années notées
i de 1à 6.
Pour l'année i le budget de publicité est x i ,le chiffre des ventes est y i .
Question 1
Y a t il une corrélation entre le chiffre des ventes et le budget de publicité,
comment mesurer cette corrélation?
Pour répondre à cette question il faut calculer la covariance et le coefficient de
corrélation (voir plus loin).
Question 2
Peut-on donner une évaluation du montant des ventes pour un budget de
publicité par exemple de 37000 euros?
Pour répondre à cette question il faut effectuer un ajustement, par exemple
trouver l'équation d'une droite d'ajustement, par exemple: la droite des
moindres carrés (voir plus loin)
Question 3
L'évaluation effectuée dans la question 2 est-elle valable?
Si le coefficient de corrélation est proche de 1 ou de −1 l'évaluation effectuée
dans la question précédente est valable, sinon elle ne l'est pas (voir plus loin).
Haut du document
4
Calcul de la covariance sur la base de l'exemple
ii
xy
Le tableau suivant est une série statistique double:
26 27 29 31 32 35
4.5 4.8 4.95 5.1 5.25 5.4
Cette série double est la suite des 6 couples
( x i , yi ) pour i = 1,2,3,4,5,6.
{ ( x1 = 26; y1 = 4.5) , ( x 2 = 27, y 2 = 4.8) , ( x 3 = 29 , y3 = 4.95) ,
( x 4 = 31 , y 4 = 5.1) , ( x 5 = 32 , y5 = 5.25 ) , ( x 6 = 35 , y 6 = 5.4) }.
Définition de la covariance
i =6
∑ ( x i − x ) × ( y i − y)
cov(x , y) = i =1
6
La covariance se calcule plus simplement ainsi
i =6
∑ x i × yi
cov(x , y) = i =1
− x×y
6
Exercice
Calculer de deux manières la covariance de la série statistique double de
l’exemple.
Réponse
cov(x , y) = 0.875
Haut du document
5
Calcul du coefficient de corrélation sur la base de l'exemple
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
1) On calcule la variance de la série statistique x donnée par :
x i 26 27 29 31 32 35
i =6
∑
V( x ) = i =1
(x i − x) 2
i=6
∑
xi2
= i =1
− (x) 2
6
6
2) On calcule la variance de la série statistique y donnée par :
y i 4.5 4.8 4.95 5.1 5.25 5.4
i =6
∑
V( y) = i =1
( y i − y) 2
i =6
∑
yi 2
= i =1
− ( y) 2
6
6
3) Le coefficient de corrélation entre x et y est :
cov(x , y)
r ( x , y) =
V ( x ) × V ( y)
Remarque
cov(x , y)
r ( x , y) =
σx × σY
Ecart type de la série statistique x
σ x = V( x )
Ecart type de la série statistique y
σ y = V ( y)
Information très importante
Pour une série statistique double on a toujours :
cov(x , y)
− 1 < r ( x , y) =
< +1
σ x × σY
Exercice Calculer le coefficient de corrélation de la série double de l’exemple.
Réponse
r ( x , y) = 0.968
Haut du document
6
La droite des moindres carrés de y en x pour l'exemple
La droite des moindres carrés de y en x admet dans le repère dans lequel le
nuage statistique a été représenté l’équation :
y − y = a ( x − x ).
Le coefficient directeur de cette droite ce calcule ainsi :
cov(x , y)
a=
.
V( x )
Remarques
1) La droite des moindres carré de y en x passe par le point moyen
M ( x , y)
2) La droite des moindres carré de y en x admet pour équation
y = ax + b
avec : b = y − ax
3) Le coefficient directeur de la droite des moindres carrés de y en x est relié au
coefficient de corrélation par :
V ( y)
a = r ( x , y)
V( x )
a = r ( x , y) ×
σy
σx
Exercice
Donner une équation de la droite des moindres carrés de l’exemple.
Réponse
a = 0.093
y − 5 = 0.093( x − 30)
y = 0.093x + 2.21
Haut du document
7
La prévision
On connaît les chiffres des ventes qui correspondent à 6 budgets de publicité,
sur la base de ces informations on prévoit le chiffre des ventes pour un budget
de publicité hypothétique p en remplaçant x par p dans l’équation de la droite
des moindres carrés de y en x et en calculant la valeur de y correspondante.
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
Les calculs effectués ont donné les résultats suivants
x = 30
y=5
v( x ) = 9.333
V( y) = 0.0875
cov(x , y) = 0.875
r ( x , y) = 0.968
a = 0.093
y − 5 = 0.093( x − 30)
y = 0.093x + 2.21
Une prévision du chiffre des ventes pour un budget de publicité de 37 milliers
d’euros est :
y = 0.093 × 37 + 2.21
y = 5.651
Le chiffre des ventes prévu pour un budget de publicité de 37 milliers d’euros
est : 5.651 milliers d’unités.
Cette prévision est valable car le coefficient de corrélation est proche de 1 :
r(x, y)= 0.968.
Haut du document
Téléchargement