UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE
U.F.R. SEGMI Année universitaire 2015 – 2016
L1 Économie Cours de B. Desgraupes
Corrigé des exercices de Statistiques Descriptives
Séance 10: Régression linéaire
Corrigé ex. 1 : Vitesse et distance de freinage
Vitesse 4 7 8 9 10 11 11 12 12 13
Distance 2 4 16 10 26 17 28 20 28 26
Vitesse 14 15 15 16 17 18 19 20 24 25
Distance 36 26 54 40 50 76 46 48 92 85
a) Calcul des moyennes arithmétiques.
On trouve facilement µV= 14 et µD= 36,5.
b) Calcul des variances.
On trouve Var(V) = 28,3et Var(D) = 610,65.
c) Calcul de la droite de régression DD|Vde la distance par rapport à la vitesse.
Notons y=a x +bl’équation de cette droite. Il faut trouver aet b.
On commence par calculer la covariance des variables Vet D:
Cov(V, D) = 1
20 X
i
(ViµV) (DiµD) = ··· = 121,6
La pente de la droite de régression de Dpar rapport à Vest définie comme
a=Cov(V, D)
Var(V)
On obtient donc
a=121,6
28,3= 4,297
On calcule ensuite le coefficient bpar la formule
b= ¯ya¯x=µDa µV= 36,54,297 ×14 = 23,658
Finalement l’équation de la droite est :
DD|V:y= 4,297 x23,658
d) Calcul de la droite de régression DV|Dde la vitesse par rapport à la distance.
On procède comme précédemment en inversant le rôle de Det de V.
Notons x=a0y+b0l’équation de cette droite. Il faut trouver a0et b0.
La covariance est symétrique en les deux variables :
Cov(D, V ) = Cov(V, D) = 121,6
La pente de la droite de régression de Dpar rapport à Vest définie comme
a0=Cov(D, V )
Var(D)
On obtient donc
a0=121,6
610,65 = 0,199
On calcule ensuite le coefficient b0par la formule
b0= ¯xa0¯y=µVa0µD= 14 0,199 ×36,5=6,736
Finalement l’équation de la droite est :
DV|D:x= 0,199 y+ 6,736
e) Représentation graphique des deux droites de régression.
Pour représenter les deux droites sur le même graphique, on réécrit l’équation de la
seconde sous la forme :
y=1
a0xb0
a0
On obtient la figure suivante. Les deux droites se coupent au barycentre Gdont les
coordonnées sont respectivement les moyennes µVet µD.
5 10 15 20 25
0 20 40 60 80
Distances de freinage
Vitesse
Distance
G
droite D|V
droite V|D
2
D’après le cours, la racine carrée du produit des pentes représente le cosinus de
l’angle que font les deux droites. On calcule :
a a0=p4,297 ×0,199 = 0,925
Cela correspond à un angle de 22,33˚.
f) Calcul du coefficient de corrélation linéaire.
D’après le cours, le coefficient de corrélation linéaire est défini par
r=Cov(D, V )
σDσV
On calcule :
r=121,6
610,65 ×28,3= 0,925
On retrouve la quantité a a0calculée dans la question précédente. C’est normal
car effectivement on a la relation r2=a a0.
La valeur 0,925 est proche de 1 : on en déduit qu’il y a une forte corrélation linéaire
entre les deux variables. Cela suggère une forte dépendance linéaire (qu’il faudrait
vérifier par la connaissance des deux variables). Le diagramme de dispersion, par sa
forme allongée et rectiligne, semble confirmer cette dépendance.
Corrigé ex. 2 : Geyser Old Faithful
Attente 79 54 74 62 85 55 88 85 51 85
Éruption 3.6 1.8 3.3 2.3 4.5 2.9 4.7 3.6 2.0 4.3
Attente 54 84 78 48 83 52 62 84 52 79
Éruption 1.8 3.9 4.2 1.8 4.7 2.2 1.8 4.8 1.6 4.2
Attente 51 48 78 69 74 83 55 76 78 79
Éruption 1.8 1.8 3.5 3.1 4.5 3.6 2.0 4.1 3.8 4.4
a) Calcul des moyennes et des variances des durées d’éruption et des temps d’at-
tente.
Le calcul ne présente aucune difficulté en appliquant les formules. On trouve :
Moyenne Variance
Attente 69.5 188.45
Éruption 3.22 1.214
b) Calculer la droite de régression DE|Ades éruptions par rapport aux temps d’at-
tente par la méthode des moindres carrés.
Notons y=a x +bl’équation de cette droite. Il faut trouver aet b.
3
On commence par calculer la covariance des variables Aet E:
Cov(A, E) = 1
30 X
i
(AiµA) (EiµE) = ··· = 13.98
La pente de la droite de régression de Epar rapport à Aest définie comme
a=Cov(A, E)
Var(A)
On obtient donc
a=13.98
188.45 = 0.074
On calcule ensuite le coefficient bpar la formule
b= ¯ya¯x=µEa µA= 3.22 0.074 ×69.5 = 1.923
Finalement l’équation de la droite est :
DE|A:y= 0.074 x1.923
c) Représentation graphique du diagramme de dispersion et de la droite de régres-
sion.
50 60 70 80
1.5 2.0 2.5 3.0 3.5 4.0 4.5
Geyser Old Faithful
Attente
Eruption
G
µA=69.5
µE=3.22
On a placé le barycentre Gdu nuage de points qui a pour coordonnées les moyennes
des deux variables (69.5,3.22).
d) Pour les deux variables, répartir les données en 4 classes d’amplitude égale et
dresser le tableau de contingence.
4
Les valeurs extrêmes de la variable A(temps d’attente) sont 48 et 88. On construit
les classe d’amplitude égale suivantes : [48,58),[58,68),[68,78) et [78,88]. Pour les
calculs, on remplacera chaque classe par son milieu (respectivement 53, 63, 73, 83).
Les valeurs extrêmes de la variable E(durée d’éruption) sont 1,6 et 4,8. On construit
les classe d’amplitude égale suivantes : [1.6,2.4),[2.4,3.2),[3.2,4) et [4,4.8]. Pour les
calculs, on remplacera chaque classe par son milieu (respectivement 2, 2.8, 3.6, 4.4).
En répartissant les données selon ces classes, on obtient le tableau de contingence
suivant :
A\E[1.6,2.4) [2.4,3.2) [3.2,4) [4,4.8]
[48,58) 9 1 0 0
[58,68) 2 0 0 0
[68,78) 0 1 1 2
[78,88] 0 0 6 8
e) À partir du tableau de contingence, nous allons représenter les courbes de ré-
gression CE|Aet CA|E.
Ajoutant les marges au tableau de contingence afin de pourvoir calculer les distri-
butions conditionnelles :
A\E[1.6,2.4) [2.4,3.2) [3.2,4) [4,4.8] Total
[48,58) 9 1 0 0 10
[58,68) 2 0 0 0 2
[68,78) 0 1 1 2 4
[78,88] 0 0 6 8 14
Total 11 2 7 10 30
Courbe de régression CE|A.
On en déduit les distributions conditionnelles de Esachant A(les classes de Eont
été remplacées par leur centre) :
A\E2 2.8 3.6 4.4
[48,58) 0.90 0.10 0.00 0.00
[58,68) 1.00 0.00 0.00 0.00
[68,78) 0.00 0.25 0.25 0.50
[78,88] 0.00 0.00 0.43 0.57
et les moyennes conditionnelles correspondantes :
Classes [48,58) [58,68) [68,78) [78,88]
Moyennes 2.08 2.00 3.80 4.06
Ces moyennes permettent de tracer la courbe de régression CE|A.
5
1 / 10 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !