plus souvent que prévu lorsque l'effectif d'échantillon était grand. Nous voulions également
évaluer la puissance du test pour identifier des distributions non normales, c'est-à-dire savoir
si le test d'AD avait rejeté à tort l'hypothèse nulle de normalité aussi souvent que prévu
lorsque l'effectif d'échantillon était grand.
Nous avons réalisé deux ensembles de simulations pour estimer l'erreur de 1ère espèce et la
puissance du test d'AD.
Pour estimer le taux d'erreur de 1ère espèce, nous avons d'abord généré 5 000 échantillons
ayant le même effectif et obéissant à une loi normale. Nous avons réalisé un test de
normalité d'AD sur chaque échantillon et calculé la valeur de p. Nous avons ensuite
déterminé la valeur de k, le nombre d'échantillons dont la valeur de p était inférieure ou
égale au seuil de signification. Le taux d'erreur de 1ère espèce peut ensuite être calculé
comme étant égal à k/5 000. Si le test d'AD est adéquat, l'erreur de 1ère espèce estimée doit
être très proche du seuil de signification ciblé.
Pour estimer la puissance, nous avons d'abord généré 5 000 échantillons ayant le même
effectif et obéissant à une loi non normale. Nous avons réalisé le test de normalité d'AD sur
chaque échantillon puis calculé la valeur de p. Nous avons ensuite déterminé la valeur de k,
le nombre d'échantillons dont la valeur de p était inférieure ou égale au seuil de
signification. La puissance peut ensuite être calculée comme étant égale à k/5000. Si le test
d'AD est adéquat, la puissance estimée doit être proche de 100 %.
Nous avons répété cette procédure pour des échantillons ayant des effectifs différents et
pour des populations normales et non normales différentes. Pour plus de détails sur les
méthodes et les résultats, reportez-vous à l'Annexe B.
Nos simulations ont montré que lorsque l'effectif d'échantillon est grand, le test d'AD ne
rejette pas l'hypothèse nulle plus fréquemment que prévu. La probabilité de rejet de
l'hypothèse nulle lorsque les échantillons obéissent à une loi normale (le taux d'erreur de
1ère espèce) est approximativement égale au seuil de signification cible (0,05 ou 0,1 par
exemple), même pour des effectifs d'échantillons de 10 000.
Nos simulations ont également montré que, pour la plupart des distributions non normales,
le test d'AD rejette l'hypothèse de normalité à juste titre avec une puissance proche de 1
(100 %). La puissance du test n'était faible que lorsque les données suivaient une distribution
non normale qui obéissait pratiquement à une loi normale. Cependant, dans le cas de ces