Modèles linéaires généralisés
Les modèles linéaires généralisés (McCullagh & Nelder, 1989) permettent une approche unifiée de
l’analyse biostatistique, pouvant prendre en compte différentes formes de distribution de la variable
dépendante : normale, log-normale, binomiale, poissonienne, binomiale négative etc. Deux composantes,
l’une aléatoire, l’autre systématique, sont nécessaires pour écrire le modèle :
y = µ + e
• e : erreur aléatoire
• µ : systématique (linéaire) avec fonction de lien g(µ) = Xβ
Le choix de la fonction de lien guidé par la distribution permettra de spécifier le modèle de régression
désiré (linéaire, logistique, Poisson, etc). L’interprétation des paramètres dépendra ensuite du type de
modèle :
Distribution Lien canonique Nom de la fonction
de lien
Régression Interprétation des coefficients
normale µ identité régression
linéaire
Augmentation arithmétique
binomiale log(µ /1-µ) logit régression
logistique
logitA - logitB = b
exp(b) = OR
poissonienne log (µ) log régression log-
linéaire
TauxA – tauxB = b
exp(b) = RR
Modèles linéaires généralisés mixtes
Dans les MLG classiques ou « fixes », les observations sont indépendantes, les effets β sont fixes. Les
MLG mixtes vont permettre de modéliser des observations non indépendantes (modélisation de la
variance-covariance). Un modèle mixte comprend des effets fixes (nb de modalités fixées, prenant des
valeurs constantes) et des effets aléatoires (on considère qu’il existe une loi de distribution de probabilités
sous-jacente ; les valeurs sont issues de la réalisation de cette distribution).
On peut distinguer trois types de MLGM :
1. Modèles à effets aléatoires : certains effets varient aléatoirement (∃ distribution effets patients,
centres…), s’ajoutant à la variation résiduelle
2. Modèles à coefficients aléatoires : variation aléatoire de l’effet des co-variable(s)
3. Modélisation de la structure de corrélation entre observations