Telechargé par matthieu m

Fiche ANOVA Stats

publicité
TD 10
Introduction à l’ANOVA (analyse de la variance)
ANOVA est l’acronyme de « ANalysis Of VAriance » ou « analyse de la variance » en
français
Elle permet de tester si au moins une moyenne diffère significativement des autres moyennes.
Il existe différents types d’ANOVA en fonction du plan de recherche utilisé :
•
Les ANOVA intersujets correspondent à des plans de recherche intersujets avec une ou
plusieurs VI intersujets à deux ou plus de deux modalités
•
Les ANOVA intrasujets correspondent à des plans de recherche intrasujets avec une ou
plusieurs VI intrasujets à deux ou plus de deux modalités.
•
Les ANOVA mixtes correspondent à des plans de recherche mixtes avec au moins une
ou plusieurs VI intersujets et au moins une ou plusieurs VI intrasujets, chaque VI pouvant
avoir deux ou plus de deux modalités.
1
TD 10 : Introduction à l’ANOVA
ANOVA intersujets :
Exemple pratique
Nous nous intéressons à l’effet de la consommation des boissons énergétiques (RedBull et Coca,
par rapport à de l’Eau) sur le temps de réaction dans une tâche d’identification visuelle
Notre VI (consommation de boisson) sera dans cet exemple inter-sujets
Dit autrement
•
Groupe 1 : RedBull
•
•
Groupe 2 : Coca
Groupe 3 : Eau
La statistique F dans l’ANOVA est donc un rapport entre la variance des observations entre
les modalités de la variable et la variance au sein de ces mêmes modalités.
Intuitivement, ça fait sens
Imaginez de comparer un groupe des chats à un groupe des chiens
Vous allez trouver plus de différences entre les chats et les chiens qu’entre un chat et d’autres
chats et/ou des chiens et d’autres chiens. C’est à nouveau notre rapport signal/bruit !
Cela veut dire que les catégories chats et chiens identifient bien deux groupes différents
Comment peut-on calculer ces deux variances ?
2
TD 10 : Introduction à l’ANOVA
Comme la distribution de t, la forme de la distribution de F dépend des dégrées de liberté
(df)
Pourtant, F dépend au même temps des dfinter et des dfintra
𝒔𝟐𝒊𝒏𝒕𝒆𝒓𝒎𝒐𝒅𝒂𝒍𝒊𝒕é
𝑴𝑺𝒊𝒏𝒕𝒆𝒓𝒎𝒐𝒅𝒂𝒍𝒊𝒕é
= 𝟐
=
𝒔 𝒊𝒏𝒕𝒓𝒂𝒎𝒐𝒅𝒂𝒍𝒊𝒕é
𝑴𝑺𝒊𝒏𝒕𝒓𝒂𝒎𝒐𝒅𝒂𝒍𝒊𝒕é
𝐹(𝑑𝑓_𝑖𝑛𝑡𝑒𝑟, 𝑑𝑓_𝑖𝑛𝑡𝑟𝑎)
Calculer df :
N = nombre total de sujets
k = nombre de modalités de la variable
Calculons
(la variabilité au
MSintra
!
sein des catégories, le bruit)
1 – calculez la moyenne de temps de réponse au sein de
chaque groupe
mRedBull = 105.93
mCoca = 128,01
mEau = 150,54
2 – calculez les écarts à la moyenne au sein de chaque groupe
3 – calculez les écarts au carré au sein de chaque groupe
3a – faire la somme des écarts au carré
3
TD 10 : Introduction à l’ANOVA
4 - Additionner les trois sommes des carrés
Pour obtenir notre
SSintra
!!
5 – Diviser SSintra par les dfintra
Pour obtenir notre
MSintra
!
Voilà comment on a obtenu MSintra, le dénominateur pour calculer F, notre bruit !
Calculons maintenant MSinter, le numérateur pour calculer F, notre signal!
1 – Faire la moyenne des moyennes de toutes les modalités Mx
2 – Calculer l’écart entre la moyenne de chaque modalité et la moyenne générale
4
TD 10 : Introduction à l’ANOVA
3 – Mettre ces écarts au carré
4 – Multiplier les écarts de chaque groupe par la taille du groupe
5 - Additionner les trois sommes des carrés
Pour obtenir notre
SSinter
!
6 – Diviser SSinter par les dfinter (k-1)
Pour obtenir notre
MSinter
!
On a donc :
5
TD 10 : Introduction à l’ANOVA
Calculons F :
ANOVA inter : Test de significativité
•
Nous avons vu comment calculer F
•
Et si on voulait tester des hypothèses sur ces trois moyennes ?
•
Il nous faut suivre les fameuses 5 étapes, comme pour n’importe quel test statistique
1. Formuler H0 et H1
H0 : µRedBull = µCoca = µEau
H1 : µRedBull ≠ µCoca
Ou µRedBull ≠ µ𝐸𝑎𝑢
Ou µCoca ≠ µ𝐸𝑎𝑢
2. Calculer une statistique
Nous connaissons déjà notre Fobs :
𝐹(2, 27) = 4,73
3. Calculer la probabilité d’observer une statistique aussi extrême si H0 est
vraie
6
TD 10 : Introduction à l’ANOVA
• Sur Excel
=LOI.F(Fobs;dfinter;dfintra)
=LOI.F(4,73;2;27)
Interprétation de la p-valeur
D’après nos données…
•
si nous répliquions un très grand nombre de fois notre étude avec des échantillons
aléatoires
•
1,7% de ces échantillons nous permettraient d’observer un Fobs supérieur ou égal à
4,73,
•
si H0 (i.e., µEau = µRedBull = µCoca) est vraie.
4. Comparer la p-value à un seuil de significativité fixé a priori
Nous pouvons noter que notre p-value est inférieure au seuil de significativité de 0,05 (et que
notre Fobs est plus grand que le Fcritique)
7
TD 10 : Introduction à l’ANOVA
5. Décider si on peut (ou pas) rejeter H0
D’après nos données, nous estimons que le temps moyen d’identification des images pour les
participants qui ont consommé du RedBull, du Coca ou de l’Eau est significativement différent
au regard du seuil de significativité de 0,05. Selon les conventions d’interprétation des tests
statistiques, nous pouvons donc rejeter H0
ANOVA inter : mesurer la taille d’effet
•
Il ne faut jamais oublier que la p-valeur, étant très sensible à diffèrent facteurs, comme la
taille de l’échantillon, n’est pas une indication suffisante pour faire des conclusions sur
l’importance de notre effet
•
Il est toujours utile de l’accompagner à des mesures de la taille de notre effet
•
Parmi les mesures de taille d’effet, bous avons déjà rencontré le coefficient de corrélation
dans un TD précédant
Voyons maintenant une mesure de taille d’effet pour l’ANOVA
•
Pour l’ANOVA nous pouvons estimer la part de variance expliquée par notre effet
(paramètre h2)
•
L’estimateur de ce paramètre (h2) est très simple à calculer. Étant une proportion, il est
compris entre 0 et 1
•
Un 𝒉𝟐 de 0,26 signifie que la VI explique 26% de la variabilité totale de la VD
8
TD 10 : Introduction à l’ANOVA
Téléchargement