TD 10 Introduction à l’ANOVA (analyse de la variance) ANOVA est l’acronyme de « ANalysis Of VAriance » ou « analyse de la variance » en français Elle permet de tester si au moins une moyenne diffère significativement des autres moyennes. Il existe différents types d’ANOVA en fonction du plan de recherche utilisé : • Les ANOVA intersujets correspondent à des plans de recherche intersujets avec une ou plusieurs VI intersujets à deux ou plus de deux modalités • Les ANOVA intrasujets correspondent à des plans de recherche intrasujets avec une ou plusieurs VI intrasujets à deux ou plus de deux modalités. • Les ANOVA mixtes correspondent à des plans de recherche mixtes avec au moins une ou plusieurs VI intersujets et au moins une ou plusieurs VI intrasujets, chaque VI pouvant avoir deux ou plus de deux modalités. 1 TD 10 : Introduction à l’ANOVA ANOVA intersujets : Exemple pratique Nous nous intéressons à l’effet de la consommation des boissons énergétiques (RedBull et Coca, par rapport à de l’Eau) sur le temps de réaction dans une tâche d’identification visuelle Notre VI (consommation de boisson) sera dans cet exemple inter-sujets Dit autrement • Groupe 1 : RedBull • • Groupe 2 : Coca Groupe 3 : Eau La statistique F dans l’ANOVA est donc un rapport entre la variance des observations entre les modalités de la variable et la variance au sein de ces mêmes modalités. Intuitivement, ça fait sens Imaginez de comparer un groupe des chats à un groupe des chiens Vous allez trouver plus de différences entre les chats et les chiens qu’entre un chat et d’autres chats et/ou des chiens et d’autres chiens. C’est à nouveau notre rapport signal/bruit ! Cela veut dire que les catégories chats et chiens identifient bien deux groupes différents Comment peut-on calculer ces deux variances ? 2 TD 10 : Introduction à l’ANOVA Comme la distribution de t, la forme de la distribution de F dépend des dégrées de liberté (df) Pourtant, F dépend au même temps des dfinter et des dfintra 𝒔𝟐𝒊𝒏𝒕𝒆𝒓𝒎𝒐𝒅𝒂𝒍𝒊𝒕é 𝑴𝑺𝒊𝒏𝒕𝒆𝒓𝒎𝒐𝒅𝒂𝒍𝒊𝒕é = 𝟐 = 𝒔 𝒊𝒏𝒕𝒓𝒂𝒎𝒐𝒅𝒂𝒍𝒊𝒕é 𝑴𝑺𝒊𝒏𝒕𝒓𝒂𝒎𝒐𝒅𝒂𝒍𝒊𝒕é 𝐹(𝑑𝑓_𝑖𝑛𝑡𝑒𝑟, 𝑑𝑓_𝑖𝑛𝑡𝑟𝑎) Calculer df : N = nombre total de sujets k = nombre de modalités de la variable Calculons (la variabilité au MSintra ! sein des catégories, le bruit) 1 – calculez la moyenne de temps de réponse au sein de chaque groupe mRedBull = 105.93 mCoca = 128,01 mEau = 150,54 2 – calculez les écarts à la moyenne au sein de chaque groupe 3 – calculez les écarts au carré au sein de chaque groupe 3a – faire la somme des écarts au carré 3 TD 10 : Introduction à l’ANOVA 4 - Additionner les trois sommes des carrés Pour obtenir notre SSintra !! 5 – Diviser SSintra par les dfintra Pour obtenir notre MSintra ! Voilà comment on a obtenu MSintra, le dénominateur pour calculer F, notre bruit ! Calculons maintenant MSinter, le numérateur pour calculer F, notre signal! 1 – Faire la moyenne des moyennes de toutes les modalités Mx 2 – Calculer l’écart entre la moyenne de chaque modalité et la moyenne générale 4 TD 10 : Introduction à l’ANOVA 3 – Mettre ces écarts au carré 4 – Multiplier les écarts de chaque groupe par la taille du groupe 5 - Additionner les trois sommes des carrés Pour obtenir notre SSinter ! 6 – Diviser SSinter par les dfinter (k-1) Pour obtenir notre MSinter ! On a donc : 5 TD 10 : Introduction à l’ANOVA Calculons F : ANOVA inter : Test de significativité • Nous avons vu comment calculer F • Et si on voulait tester des hypothèses sur ces trois moyennes ? • Il nous faut suivre les fameuses 5 étapes, comme pour n’importe quel test statistique 1. Formuler H0 et H1 H0 : µRedBull = µCoca = µEau H1 : µRedBull ≠ µCoca Ou µRedBull ≠ µ𝐸𝑎𝑢 Ou µCoca ≠ µ𝐸𝑎𝑢 2. Calculer une statistique Nous connaissons déjà notre Fobs : 𝐹(2, 27) = 4,73 3. Calculer la probabilité d’observer une statistique aussi extrême si H0 est vraie 6 TD 10 : Introduction à l’ANOVA • Sur Excel =LOI.F(Fobs;dfinter;dfintra) =LOI.F(4,73;2;27) Interprétation de la p-valeur D’après nos données… • si nous répliquions un très grand nombre de fois notre étude avec des échantillons aléatoires • 1,7% de ces échantillons nous permettraient d’observer un Fobs supérieur ou égal à 4,73, • si H0 (i.e., µEau = µRedBull = µCoca) est vraie. 4. Comparer la p-value à un seuil de significativité fixé a priori Nous pouvons noter que notre p-value est inférieure au seuil de significativité de 0,05 (et que notre Fobs est plus grand que le Fcritique) 7 TD 10 : Introduction à l’ANOVA 5. Décider si on peut (ou pas) rejeter H0 D’après nos données, nous estimons que le temps moyen d’identification des images pour les participants qui ont consommé du RedBull, du Coca ou de l’Eau est significativement différent au regard du seuil de significativité de 0,05. Selon les conventions d’interprétation des tests statistiques, nous pouvons donc rejeter H0 ANOVA inter : mesurer la taille d’effet • Il ne faut jamais oublier que la p-valeur, étant très sensible à diffèrent facteurs, comme la taille de l’échantillon, n’est pas une indication suffisante pour faire des conclusions sur l’importance de notre effet • Il est toujours utile de l’accompagner à des mesures de la taille de notre effet • Parmi les mesures de taille d’effet, bous avons déjà rencontré le coefficient de corrélation dans un TD précédant Voyons maintenant une mesure de taille d’effet pour l’ANOVA • Pour l’ANOVA nous pouvons estimer la part de variance expliquée par notre effet (paramètre h2) • L’estimateur de ce paramètre (h2) est très simple à calculer. Étant une proportion, il est compris entre 0 et 1 • Un 𝒉𝟐 de 0,26 signifie que la VI explique 26% de la variabilité totale de la VD 8 TD 10 : Introduction à l’ANOVA