Modèle linéaire et applications
Atelier Statistique
Synopsis
“Statistical models are sometimes misunderstood in epidemiology. Statistical models for data are never
true. The question whether a model is true is irrelevant. A more appropriate question is whether we ob-
tain the correct scientific conclusion if we pretend that the process under study behaves according to a
particular statistical model.”
—Scott Zeger (1991)
ANOVA vs. régression
Codage des variables qualitatives
Illustration
Analyse de covariance
Approche par comparaison de modèles
Interprétation des coefficients du modèle
ANOVA à un facteur
Références
ANOVA vs. régression
ANOVA : Expliquer les variations d’une réponse numérique en fonction de vari-
ables qualitatives (facteurs), le plus souvent dans le cadre d’un plan d’expéri-
ence.
Régression : Expliquer les variations d’une réponse numérique en fonction de
variables quantitatives (explicatives ou prédictrices), en supposant également
une relation asymétrique entre les variables.
Modélisation d’une réponse continue par une combinaison linéaire de variables
explicatives :
yi=β0+
k
j=1
βjxi
Codage des variables qualitatives
> n <- 10
> x <- gl(2, 1, n, labels=letters[1:2])
> y <- 1.1 + 0.5 * as.numeric(x) + rnorm(n)
> m <- lm(y ~ x)
> formula(m)
y ~ x
> model.matrix(m)
(Intercept) xb
1 1 0
2 1 1
3 1 0
4 1 1
5 1 0
6 1 1
7 1 0
8 1 1
9 1 0
10 1 1
attr(,"assign")
[1] 0 1
attr(,"contrasts")$x
[1] "contr.treatment"
x
y
1.0
1.5
2.0
2.5
3.0
3.5
0 (a) 1 (b)
Rappel : dans le cas où la variable explicative est continue, le modèle de régres-
sion simple s’écrit yi=β0+β1xi+εi, où β0représente l’ordonnée à l’origine, β1
la pente de la droite de régression, et εiest un terme d’erreur (résidus gaussiens
centrés). La partie structurale du modèle s’écrit également y=sous forme
matricielle, où Xdésigne la matrice de design.
Si xest catégoriel, avec deux modalités, on peut écrire :
y=β0+β1I(x=b)
I(x=b) = 1si xprend la valeur b, 0 sinon. D’où,
y=β0(x=a)
=β0+β1(x=b)
L’interprétation de β1reste la même et traduit la variation de ylorsque xaug-
mente d’une unité (ab). Le coefficient β0représente la moyenne dans la
catégorie de référence. Si xakmodalités, on aura k1indicatrices codant
pour les niveaux autres que celui de référence.
1 / 18 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !