cours modeles regression

Telechargé par charif el atifi
R´
esum´
e du Cours de Mod`
eles de R´
egression
Yves Till´e
10 janvier 2011
1
Chapitre 1
R´egression bivari´ee
1.1 S´erie statistique bivari´ee
On s’ineresse `a deux variables xet y. Ces deux variables sont mesur´ees sur les nunit´es d’observation.
Pour chaque unit´e, on obtient donc deux mesures. La s´erie statistique est alors une suite de ncouples des
valeurs prises par les deux variables sur chaque individu :
(x1, y1),...,(xi, yi), . . . , (xn, yn).
Chacune des deux variables peut ˆetre soit quantitative, soit qualitative.
1.1.1 Repr´esentation graphique de deux variables
Dans ce cas, chaque couple est compos´e de deux valeurs num´eriques. Un couple de nombres (entiers ou
r´eels) peut toujours ˆetre repr´esent´e comme un point dans un plan
(x1, y1),...,(xi, yi), . . . , (xn, yn).
Exemple 1.1 On mesure le poids Yet la taille Xde 20 individus.
Table 1.1 – Taille et poids de 20 individus
yixiyixi
60 155 75 180
61 162 76 175
64 157 78 173
67 170 80 175
68 164 85 179
69 162 90 175
70 169 96 180
70 170 96 185
72 178 98 189
73 173 101 187
1.1.2 Analyse des variables
Les variables xet ypeuvent ˆetre analys´ees s´epar´ement. On peut calculer tous les param`etres dont les
moyennes et les variances :
¯x=1
n
n
i=1
xi, s2
x=1
n
n
i=1
(xi¯x)2,
2
155 160 165 170 175 180 185 190
60 70 80 90 100
taille
poids
Figure 1.1 – Le nuage de points
¯y=1
n
n
i=1
yi, s2
y=1
n
n
i=1
(yi¯y)2.
Ces param`etres sont appel´es param`etres marginaux :variances marginales,moyennes marginales,´ecarts-types
marginaux, etc.
1.1.3 Covariance
La covariance est d´efinie
sxy =1
n
n
i=1
(xi¯x)(yi¯y).
Remarque 1.1
La covariance peut prendre des valeurs positives, n´egatives ou nulles.
Quand xi=yi,pour tout i= 1, . . . n, la covariance est ´egale `a la variance.
La covariance peut ´egalement s’´ecrire
sxy =1
n
n
i=1
xiyi¯x¯y.
1.1.4 Corr´elation
Le coefficient de corr´elation est la covariance divis´ee par les deux ´ecart-types marginaux
rxy =sxy
sxsy
.
Le coefficient de corr´elation peut ˆetre interpr´et´e g´eom´etriquement. Consid´erons les deux vecteurs centr´es de
Rn:
˜
x= (x1¯x, ··· , xi¯x, ··· , xn¯x)
˜
y= (y1¯y, ··· , yi¯y, ··· , yn¯y).
Par d´efinition, le cosinus de l’angle entre, ˜
xet ˜
yvaut
cos(˜
x,˜
y) = <˜
x,˜
y>
||˜
x|| × ||˜
y||,
3
o`u <˜
x,˜
y>est le produit scalaire entre les vecteurs ˜
xet ˜
y
<˜
x,˜
y>=
n
i=1
(xi¯x)(yi¯y),
et ||˜
x|| (rep. ||˜
y||) est la norme de ˜
x(resp. ˜
y) :
||˜
x|| =
n
i=1
(xi¯x)2et ||˜
y|| =
n
i=1
(yi¯y)2.
Le coefficient de corr´elation est donc ´egal au cosinus de l’angle entre les vecteurs ˜
xet ˜
y. Comme un cosinus
est toujours compris dans [1,1], on obtient que :
1rxy 1.(1.1)
Remarque 1.2 Le coefficient de corr´elation mesure la d´ependance lin´eaire entre deux variables.
Si le coefficient de corr´elation est positif, les points sont align´es le long d’une droite croissante.
Si le coefficient de corr´elation est n´egatif, les points sont align´es le long d’une droite d´ecroissante.
Si le coefficient de corr´elation est nul ou proche de z´ero, il n’y a pas de d´ependance lin´eaire. On peut
cependant avoir une d´ependance non-lin´eaire avec un coefficient de corr´elation nul.
r=1
r=−1
r=0
r>0
r<0
r=0
Figure 1.2 – Exemples de nuages de points et coefficients de corr´elation
Remarque 1.3 La pr´esence d’une corr´elation n’implique pas forc´ement une relation de causalit´e entre les
deux variables.
Le coefficient de d´etermination (appel´e aussi R-deux ou R-carr´e) est le carr´e du coefficient de corr´elation.
r2
xy =s2
xy
s2
xs2
y
.
De l’in´egalit´e (1.1), on obtient directement que
0r2
xy 1.
4
1 / 131 100%

cours modeles regression

Telechargé par charif el atifi
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !