Cours 7 : Rappels de cours et exemples sous
R
I- Régression linéaire simple
II- Analyse de variance à 1 facteur
III- Tests statistiques
I- Le modèle de régression linéaire simple:
théorie
Rappels On cherche à expliquer ou à prévoir les variations d’une variable Y
(variable dépendante) par celles d’une fonction linéaire de X (variable
explicative), i.e., à valider le modèle de RLS
Y aX b
ε
= + +
où est une variable aléatoire gaussienne de moyenne nulle et de variance
Pour cela on observe un n-échantillon de réalisations de X et de Y, sur
lesquelles on va chercher à voir si le lien est plausible,
i.e. si il existe a, b et
(validation)
Avec i.i.d. Gaussiennes et pas trop grand,
et à approcher les valeurs des paramètres a, b, et (estimation)
, 1,..., .
i i i
y ax b i n
ε
= + + =
²
σ
²
σ
²
σ
ε
ε
²
σ
I- Le modèle de régression linéaire simple:
théorie
Estimation des paramètres :
Estimation de a et b : On commence par chercher le « meilleur » ajustement
linéaire sur nos données, au sens des moindres carrés :
=i
°
valeur estimée
ˆ
y ax b
= +
=i
°
valeur estimée
= i° résidu
et sont tels que est minimal. Ce sont les
coefficients de la régression (ou estimateurs des moindres carrés).
2
1 1
ˆ
ˆ
( )²
n n
i i i
i i
e y ax b
= =
= − −
∑ ∑
ˆ
a
ˆ
b
ˆ
ˆ
y ax b
i i
e y y
i i i
= +
= −
I- Le modèle de régression linéaire simple:
théorie
On montre que :
La droite d’ajustement s’appelle droite de régression ou des
1
1
( )( ) ˆ
ˆ ˆ
,
( )²
n
i i
in
i
i
x x y y
a b y ax
x x
=
=
− −
= = −
ˆ
ˆ
y ax b
= +
La droite d’ajustement s’appelle droite de régression ou des
moindres carrés.
La valeur estime la valeur moyenne de Y lorsque X=xi (E(Y/X=xi)) .
C’est aussi la prévision de Y pour une observation telle que X=xi.
Estimation de : La variance de l’erreur s’estime par
ˆ
y
i
2
1
²
2 2
n
i
i
e
SSR
s
n n
=
= =
− −
ˆ
ˆ
y ax b
= +
²
σ
I- Le modèle de régression linéaire simple:
théorie
Validation du modèle sur les données :il faut que le modèle soit de
bonne qualité (bon pouvoir explicatif et prédictif)
Analyse de la qualité du modèle : Décomposition de la variabilité
=somme des carrés des variations de y
2
( )²
i Y
SST y y ns
= − =
=somme des carrés des variations expliquées
par le modèle
=somme des carrés des variations résiduelles
On montre que : SST=SSR+SSM
Au plus SSM est grand (ou SSR faible), au meilleur est l’ajustement.
2
ˆ
( )²
i
Y
SSM y y s
= − =
2 2
( 2)
i
SSR e n s
= = −
1 / 66 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !