Université Jean Monnet I U T de ROANNE
L. P. Gestion de la Production Industrielle G. Simonnet
1
ANALYSE DE LA VARIANCE
I. Présentation de la méthode :
1) L’idée :
Au début du XXe siècle, R. Fischer développe la méthodologie des plans d’expérience. Pour
valider l’utilité d’un facteur, il met au point un test permettant d’assurer que des échantillons
différents sont de nature différentes. Ce test est basé sur l’analyse de la variance (des échantillons), et
nommé ANOVA (analyse normalisée de la variance).
L’idée est de tester l’hypothèse H0 : ‘les échantillons sont représentatifs d’une même
population (d’une même loi statistique)’ ; Autrement dit, les variations constatées entre les valeurs des
différents échantillons sont dues essentiellement au hasard. Pour cela on étudie la variabilité des
résultats dans les échantillons et entre les échantillons.
Nous étudierons le cas d’échantillons de même taille, mais la méthode s’adapte à des
échantillons de tailles différentes.
2) Notations et vocabulaire :
Nous prenons k échantillons de n valeurs chacun.
Notations:
i est l’indice d’échantillon (de 1 à k), j l’indice de l’observation(de 1 à n)
xij : valeur de la jème observation de l’échantillon i
: moyenne de l’échantillon i
N : nombre total d’observation N = k.n
: moyenne des N valeurs = moyenne des
i
2 . 1 ) La variance globale
La variance globale est la variance estimée en considérant l’ensemble des N essais comme un
seul échantillon.
. Le nombre de degré de liberté (ddl) est égal à : N - 1 = T.
A priori, la variance globale n’a pas une grande signification, car les individus sont pris de
façon groupée, par échantillons dans des sous - populations. C’est la quantité
qui
retiendra notre attention : elle donne la somme des carrés des écarts à la moyenne. On l’appelle la
somme des carrés totale, ou la variation totale.
2 . 2 ) La variance entre échantillons
La variance entre échantillons (c a d entre les moyennes des échantillons) est l’estimateur de
la variance des moyennes des échantillons:
(On estime la variance due au facteur
éventuel qui différencie les échantillons). Comme la variance des individus (2 ) vaut n fois celle des