Régression linéaire Analyse statistique de deux variables

Téléchargement

1B.C.P.S.T–VÉTO2 Régression linéaire

Analyse statistique de deux variables

Soient deux séries statistiques Xet Y,quiprennentlesvaleurs(x1,y

1),...,(xn,y

n)X x1··· ··· xn

Y y1··· ··· yn

La représentation graphique donne un nuage de points Mi(1 6i6n).

?Les moyennes de Xet Ysont respectivement X=1

n(x1+···+xn)= 1

i=1

xiet Y=1

i=1

?Les variances sont V(X)= 1

n n

i=1

i!X2et V(Y)= 1

n n

i=1

i!Y2

?Enﬁn, cov(X, Y )= 1

i=1

(xiX)(yiY)= 1

n n

i=1

xiyi!X Y

Ajustement linéaire

On cherche si Ydépend de façon aﬃne de X,c’estàdires’ilexisteunedroite,d’équationy=ax+bqui

approxime le nuage de points (Mi)decoordonnées(xi,y

i)pour i2[[ 1 ,n]] .

Pour cela, une telle droite étant donnée, on déﬁnit les points Pi,projetéssurdes points Mi,parallèlement

àl’axedesordonnées.DoncsiMiapourcoordonnées(xi,y

i),Piapourabscissexi(la même que Mi), et pour

ordonnée ax

i+bpuisque Piappartient à .Ladroitecherchée–ditedroite de régression–estcellequiminimise

les distances MiPi,ouplusexactement

i=1

(MiPi)2.

Cette somme peut être considérée comme une fonc-

tion fdes deux variables aet b;enparticu-

lier, pour adonné, c’est un polynôme du se-

cond degré en b,quiadmetunminimumaupoint

b0=

i=1

(yiax

n=Ya X.MiPi=|yiax

ib|,

donc

i=1

MiP2

i=1

((yiax

i)b)2

i=1

(yiax

i)22b

i=1

(yiax

i)+b2n

Cette valeur de bétant déterminée, l’expression de f

devient f(a, Ya X)=

i=1

((yiY)a(xiX))2=

y=ax+b

i=1

(yiY)22a

i=1

(xiX)(yiY)+a2

i=1

(xiX)2;c’estunefonctiondelaseulevariablea.

On cherche à nouveau le minimum, atteint pour a0=Pn

i=1(xiX)(yiY)

i=1(xiX)2=cov(X, Y )

V(X),ladroitederégression

adoncpouréquationyY=cov(X, Y )

V(X)(xX);onremarquequ’ellepasseparlebarycentreGdu nuage de

points de coordonnées (X,Y)

Coeﬃcient de corrélation linéaire

Pour 2R,onétudielavariancedeX+Y:V(X+Y)=2V(X)+2cov(X, Y )+V(Y)cette valeur

étant toujours positive, le discriminant = 4(cov2(X, Y )V(X)V(Y)) est négatif. On en déduit que le coeﬃcient

⇢(X, Y )= cov(X, Y )

pV(X)V(Y)2[1,1].

D’autre part, V(X+Y)est minimale pour 0=cov(X, Y )

V(X)=a0.Ladroitederégressioncalculéeminimise

la variance de la variable aléatoire X+Y.

Lorsque le discriminant est nul (c’est à dire lorsque ⇢(X, Y )=1ou 1,leminimumestnul.Danscecas,0X+Y

est une variable aléatoire de variance nulle, elle est donc constante (égale à K2R). Donc Y=0X+K;Yest

exactement fonction aﬃne de X,lespointsMisont alignés et appartiennent tous à la droite de régression.

Conclusion

Plus le coeﬃcient de corrélation linéaire ⇢(X, Y )est proche de 1 en valeur absolue, meilleure est l’approximation

aﬃne. Un coeﬃcient trop proche de 0remet en question la dépendance de Ypar rapport à X.Lesignedea(donc

de ⇢(X, Y )ou encore de 0)représentelesensdevariationen moyenne de Yen fonction de X.

Exercices d’application

Exemple 1 Deux techniques diﬀérentes «Biorad» (X)et «Isolab» (Y)ont été utilisées dans les mêmes condi-

tions pour doser la quantité d’hémoglobine glycosylée dans 10 échantillons de sang provenant de 10 malades

présumés. Les densités optiques obtenues sont consignées dans le tableau ci-dessous :

Biorad (xi)7,1 7,5 7,6 7,9 8,0 8,1 8,1 8,3 8,5 8,9

Isolab (yi)6,4 7,0 6,7 7,5 7,9 7,5 8,0 8,1 8,1 8,0

1. Déterminer l’équation de la droite de régression linéaire de Yen fonction de X.

2. Calculer le coeﬃcient de corrélation linéaire, conclusion ?

3. Déterminer l’équation de la droite de régression linéaire de Xen fonction de Y,remarque?

Exemple 2 Mêmes questions concernant l’étude de deux caractères sur une population de dix individus :

xi208 185 206 170 188 199 184 203 196 161

yi113 83 99 66 88 98 102 96 100 56

1 / 2 100%

Documents connexes

responsable du developpement commercial

TERMINALE ES QCM n°6 : correction

Principales notations

Initiation à la régression linéaire simple avec R

Covariance

Introduction au Modèle Linéaire

Distribution d`une variable alatoire, moyenne et variance

Fonction homographique et comportement d`oiseaux

Gamme 3M série AP2-G

Exercices de Statistiques Descriptives - Sciences Économiques

Corrigé de la séance 10

La réponse à la sélection

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Régression linéaire Analyse statistique de deux variables

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Régression linéaire Analyse statistique de deux variables

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib