3
- ce que le modèle ne décrit pas (omission de variables
explicatives dans le modèle)
- l’effet individuel. Celui-ci traduit la part de la valeur observée
due à l’individu. Des individus avec les mêmes caractéristiques pour
les variables explicatives n’ont pas les mêmes valeurs car la variable
Y présente une variabilité naturelle.
- L’erreur expérimentale, l’erreur commise lors de la mesure.
Cette erreur doit donc être minimisée.
La variance résiduelle (variance des résidus) mesure la dispersion des
résidus. Si aucune variable n’est omise dans le modèle, cette variance
résulte de la variabilité entre individus et de la variabilité des erreurs
de mesure. Elle mesure la variabilité existant dans chaque population
correspondant à une modalité du facteur étudié (ou à chaque
combinaison des facteurs étudiés).
Modèle linéaire
Un modèle est linéaire si son expression mathématique est une
combinaison linéaire des paramètres du modèle. Pour l’analyse de
variance, cette combinaison linéaire est une somme de paramètres. Les
résidus sont des variables aléatoires qui suivent des conditions qu’on
appelle postulats du modèle linéaire.
Test statistique / Statistique de test
Un test statistique permet de choisir une hypothèse relative à des
populations, parmi deux hypothèses envisagées, H0 et H1. Une seule de
ces hypothèses est vraie.
La décision est basée sur une statistique de test dont la valeur est
calculée à partir des échantillons.
La statistique de test suit une loi de probabilité connue quand
l’hypothèse nulle H0 est vraie. Quelle que soit la décision prise à l’issue du
test statistique, elle est assortie d’une erreur ayant une probabilité. Si on
rejette H0 (c'est-à-dire si on accepte H1), l’erreur commise, rejeter H0
alors qu’elle est vraie, est l’erreur de première espèce. Sa probabilité est
appelée risque de 1ère espèce, ; elle est fixée a priori par la personne
interprétant l’étude. Si on accepte H0, l’erreur commise, accepter H0 alors
qu’elle est fausse, s’appelle l’erreur de deuxième espèce. Sa probabilité
est le risque de 2ème espèce, ; sa valeur n’est pas connue (mais peut
être calculée) et dépend de l’hypothèse H1.
Un test statistique est paramétrique si les deux hypothèses
formulées portent sur des paramètres caractérisant une variable dans des
populations. Les tests statistiques utilisés en analyse de variance sont des
tests paramétriques car ils font intervenir des moyennes de populations.
Statistique inférentielle
C’est l’ensemble des méthodes qui permettent de caractériser des
populations en utilisant les observations réalisées sur des échantillons
issus des populations. A partir des échantillons, on conclut sur les
populations, à l’aide d’intervalles de confiance ou de tests statistiques.