Rappel : dans le cas où la variable explicative est continue, le modèle de régres-
sion simple s’écrit yi=β0+β1xi+εi, où β0représente l’ordonnée à l’origine, β1
la pente de la droite de régression, et εiest un terme d’erreur (résidus gaussiens
centrés). La partie structurale du modèle s’écrit également y=Xβ sous forme
matricielle, où Xdésigne la matrice de design.
Si xest catégoriel, avec deux modalités, on peut écrire :
y=β0+β1I(x=b)
où I(x=b) = 1si xprend la valeur b, 0 sinon. D’où,
y=β0(x=a)
=β0+β1(x=b)
L’interprétation de β1reste la même et traduit la variation de ylorsque xaug-
mente d’une unité (a→b). Le coefficient β0représente la moyenne dans la
catégorie de référence. Si xakmodalités, on aura k−1indicatrices codant
pour les niveaux autres que celui de référence.