Corrigé de la séance 10

Téléchargement

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE

U.F.R. SEGMI Année universitaire 2015 – 2016

L1 Économie Cours de B. Desgraupes

Corrigé des exercices de Statistiques Descriptives

Séance 10: Régression linéaire

Corrigé ex. 1 : Vitesse et distance de freinage

Vitesse 4 7 8 9 10 11 11 12 12 13

Distance 2 4 16 10 26 17 28 20 28 26

Vitesse 14 15 15 16 17 18 19 20 24 25

Distance 36 26 54 40 50 76 46 48 92 85

a) Calcul des moyennes arithmétiques.

On trouve facilement µV= 14 et µD= 36,5.

b) Calcul des variances.

On trouve Var(V) = 28,3et Var(D) = 610,65.

c) Calcul de la droite de régression DD|Vde la distance par rapport à la vitesse.

Notons y=a x +bl’équation de cette droite. Il faut trouver aet b.

On commence par calculer la covariance des variables Vet D:

Cov(V, D) = 1

20 X

(Vi−µV) (Di−µD) = ··· = 121,6

La pente de la droite de régression de Dpar rapport à Vest déﬁnie comme

a=Cov(V, D)

Var(V)

On obtient donc

a=121,6

28,3= 4,297

On calcule ensuite le coefﬁcient bpar la formule

b= ¯y−a¯x=µD−a µV= 36,5−4,297 ×14 = −23,658

Finalement l’équation de la droite est :

DD|V:y= 4,297 x−23,658

d) Calcul de la droite de régression DV|Dde la vitesse par rapport à la distance.

On procède comme précédemment en inversant le rôle de Det de V.

Notons x=a0y+b0l’équation de cette droite. Il faut trouver a0et b0.

La covariance est symétrique en les deux variables :

Cov(D, V ) = Cov(V, D) = 121,6

La pente de la droite de régression de Dpar rapport à Vest déﬁnie comme

a0=Cov(D, V )

Var(D)

On obtient donc

a0=121,6

610,65 = 0,199

On calcule ensuite le coefﬁcient b0par la formule

b0= ¯x−a0¯y=µV−a0µD= 14 −0,199 ×36,5=6,736

Finalement l’équation de la droite est :

DV|D:x= 0,199 y+ 6,736

e) Représentation graphique des deux droites de régression.

Pour représenter les deux droites sur le même graphique, on réécrit l’équation de la

seconde sous la forme :

y=1

a0x−b0

On obtient la ﬁgure suivante. Les deux droites se coupent au barycentre Gdont les

coordonnées sont respectivement les moyennes µVet µD.

5 10 15 20 25

0 20 40 60 80

Distances de freinage

Vitesse

Distance

droite D|V

droite V|D

D’après le cours, la racine carrée du produit des pentes représente le cosinus de

l’angle que font les deux droites. On calcule :

√a a0=p4,297 ×0,199 = 0,925

Cela correspond à un angle de 22,33˚.

f) Calcul du coefﬁcient de corrélation linéaire.

D’après le cours, le coefﬁcient de corrélation linéaire est déﬁni par

r=Cov(D, V )

σDσV

On calcule :

r=121,6

√610,65 ×28,3= 0,925

On retrouve la quantité √a a0calculée dans la question précédente. C’est normal

car effectivement on a la relation r2=a a0.

La valeur 0,925 est proche de 1 : on en déduit qu’il y a une forte corrélation linéaire

entre les deux variables. Cela suggère une forte dépendance linéaire (qu’il faudrait

vériﬁer par la connaissance des deux variables). Le diagramme de dispersion, par sa

forme allongée et rectiligne, semble conﬁrmer cette dépendance.

Corrigé ex. 2 : Geyser Old Faithful

Attente 79 54 74 62 85 55 88 85 51 85

Éruption 3.6 1.8 3.3 2.3 4.5 2.9 4.7 3.6 2.0 4.3

Attente 54 84 78 48 83 52 62 84 52 79

Éruption 1.8 3.9 4.2 1.8 4.7 2.2 1.8 4.8 1.6 4.2

Attente 51 48 78 69 74 83 55 76 78 79

Éruption 1.8 1.8 3.5 3.1 4.5 3.6 2.0 4.1 3.8 4.4

a) Calcul des moyennes et des variances des durées d’éruption et des temps d’at-

tente.

Le calcul ne présente aucune difﬁculté en appliquant les formules. On trouve :

Moyenne Variance

Attente 69.5 188.45

Éruption 3.22 1.214

b) Calculer la droite de régression DE|Ades éruptions par rapport aux temps d’at-

tente par la méthode des moindres carrés.

Notons y=a x +bl’équation de cette droite. Il faut trouver aet b.

On commence par calculer la covariance des variables Aet E:

Cov(A, E) = 1

30 X

(Ai−µA) (Ei−µE) = ··· = 13.98

La pente de la droite de régression de Epar rapport à Aest déﬁnie comme

a=Cov(A, E)

Var(A)

On obtient donc

a=13.98

188.45 = 0.074

On calcule ensuite le coefﬁcient bpar la formule

b= ¯y−a¯x=µE−a µA= 3.22 −0.074 ×69.5 = −1.923

Finalement l’équation de la droite est :

DE|A:y= 0.074 x−1.923

c) Représentation graphique du diagramme de dispersion et de la droite de régres-

sion.

50 60 70 80

1.5 2.0 2.5 3.0 3.5 4.0 4.5

Geyser Old Faithful

Attente

Eruption

µA=69.5

µE=3.22

On a placé le barycentre Gdu nuage de points qui a pour coordonnées les moyennes

des deux variables (69.5,3.22).

d) Pour les deux variables, répartir les données en 4 classes d’amplitude égale et

dresser le tableau de contingence.

Les valeurs extrêmes de la variable A(temps d’attente) sont 48 et 88. On construit

les classe d’amplitude égale suivantes : [48,58),[58,68),[68,78) et [78,88]. Pour les

calculs, on remplacera chaque classe par son milieu (respectivement 53, 63, 73, 83).

Les valeurs extrêmes de la variable E(durée d’éruption) sont 1,6 et 4,8. On construit

les classe d’amplitude égale suivantes : [1.6,2.4),[2.4,3.2),[3.2,4) et [4,4.8]. Pour les

calculs, on remplacera chaque classe par son milieu (respectivement 2, 2.8, 3.6, 4.4).

En répartissant les données selon ces classes, on obtient le tableau de contingence

A\E[1.6,2.4) [2.4,3.2) [3.2,4) [4,4.8]

[48,58) 9 1 0 0

[58,68) 2 0 0 0

[68,78) 0 1 1 2

[78,88] 0 0 6 8

e) À partir du tableau de contingence, nous allons représenter les courbes de ré-

gression CE|Aet CA|E.

Ajoutant les marges au tableau de contingence aﬁn de pourvoir calculer les distri-

butions conditionnelles :

A\E[1.6,2.4) [2.4,3.2) [3.2,4) [4,4.8] Total

[48,58) 9 1 0 0 10

[58,68) 2 0 0 0 2

[68,78) 0 1 1 2 4

[78,88] 0 0 6 8 14

Total 11 2 7 10 30

•Courbe de régression CE|A.

On en déduit les distributions conditionnelles de Esachant A(les classes de Eont

été remplacées par leur centre) :

A\E2 2.8 3.6 4.4

[48,58) 0.90 0.10 0.00 0.00

[58,68) 1.00 0.00 0.00 0.00

[68,78) 0.00 0.25 0.25 0.50

[78,88] 0.00 0.00 0.43 0.57

et les moyennes conditionnelles correspondantes :

Classes [48,58) [58,68) [68,78) [78,88]

Moyennes 2.08 2.00 3.80 4.06

Ces moyennes permettent de tracer la courbe de régression CE|A.

1 / 10 100%

Documents connexes

Régression linéaire Analyse statistique de deux variables

Introduction au Modèle Linéaire

TERMINALE ES QCM n°6 : correction

Fonction homographique et comportement d`oiseaux

COUPLES DE VARIABLES ALÉATOIRES DISCRÈTES

TD Statistique & Reconnaissance de Formes - MATLAB

Télécharger - Annales partiels ENSTBB

Text mining

JMP® : ANOVA et Régression

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Corrigé de la séance 10

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Corrigé de la séance 10

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib