Test t de Student et ONEWAY (Corrigé) /25 I2 Connaissances préalables : Test t de comparaison de moyennes pour échantillon indépendants; analyse de la variance à un facteur. application d'un test d'hypothèse TI-83 ; Programmes utilisateur : T2ECH; T1FAC; DISTR Arrondissez les résultats numériques à 3 décimales. Buts spécifiques : Outils nécessaires : Consignes générales : Trois méthodes de psychothérapie sont utilisées pour combattre la peur du vide (méthode A, méthode B et méthode C). Trois échantillons aléatoires simples indépendants de sujets sont utilisés dans l'expérience. Après le traitement, les sujets sont appelés à se rapprocher le plus près possible du bord d'un gouffre. Les distances sont mesurées en mètres. Voici les résultats observés par groupe : Groupe 1 (méthode A) 3 2 2,5 3,5 3 3,5 3 4 2,5 2 Groupe 2 (méthode B) 3,5 3,5 1,5 2,5 3 2,5 3 2 3 2 Groupe 3 (méthode C) 1,5 2 3,5 2,5 2 2,5 2,5 2,5 2 2 3 1 2,5 1. Calculez, pour chaque groupe , la moyenne ainsi que l’écart-type (non corrigé) des résultats observés. Groupe 1 (méthode A) Groupe 2 (méthode B) Groupe 3 (méthode C) Moyenne 2,955 2,450 2,333 Ecart-type 0,620 0,650 0,589 /2 2. De manière intuitive, que peut-on dire de l'efficacité moyenne comparée des trois méthodes ? Réponse : La méthode C semble en moyenne plus efficace que la méthode B, et celle-ci paraît en moyenne plu performante que la méthode A. /1 I2/Corrigé -1/4 - On se propose d'effectuer une comparaison des moyennes à l’aide d’un test statistique. 3. Comparez les méthodes deux à deux (au niveau de 0,05, test bilatéral) à l'aide du test t de comparaison de moyennes pour échantillons indépendants et complétez le tableau suivant : différence entre moyennes valeur de T observée seuil de rejet (bilatéral) p-valeur t obs groupe 1 vs groupe 2 0,505 1,731 t19;0,975 = 2,093 0,100 groupe 1 vs groupe 3 0,622 2,354 t21;0,975 = 2,080 0,028 groupe 2 vs groupe 3 0,117 0,421 t20;0,975 = 2,086 0,678 /6 4. Décision et interprétation au niveau de 0,05. Décision et interprétation groupe 1 vs groupe 2 On ne rejette pas l'hypothèse d'égalité des moyennes. Aucune de ces deux méthodes ne semble supérieure en moyenne à l'autre. groupe 1 vs groupe 3 On rejette l'hypothèse d'égalité des moyennes. La méthode C semble apporter de meilleurs résultats en moyenne que la méthode A. groupe 2 vs groupe 3 On ne rejette pas l'hypothèse d'égalité des moyennes. Aucune de ces deux méthodes ne semble supérieure en moyenne à l'autre. /3 5. Quelles sont les hypothèses de travail qui doivent être satisfaites pour pouvoir appliquer le test t pour échantillons indépendants ? Dites si elles sont vérifiées dans le cas d'espèce. Réponse : Les échantillons utilisés doivent être aléatoires simples indépendants. La variable étudiée doit se distribuer selon une loi normale dans les trois populations dont sont extraits les échantillons. Les variances des populations dont sont extraits les échantillons doivent être homogènes (On peut raisonnablement penser que cette dernière hypothèse est bien satisfaite, puisque les trois variances-échantillons présentent seulement des différences négligeables). /2 I2/Corrigé -2/4 - On propose d'effectuer une analyse de la variance à un facteur sur les données. 6. Effectuez maintenant une analyse de la variance à un facteur sur l'ensemble des données (niveau de 0,05) et complétez le tableau ci-après : Source de variation Inter- groupes Somme des carrés 2,442 degrés de liberté 2 Carrés moyens 1,221 Intra-groupes 12,619 30 0,421 Total 15,061 32 rapport F 2,902 Seuil de rejet 3,32 p-valeur 0,070 /5 7. Quelles sont les hypothèses de travail qui doivent être satisfaites pour pouvoir appliquer l'analyse de la variance à un facteur ? Dites si elles sont vérifiées dans le cas d'espèce. Réponse : Les échantillons utilisés doivent être aléatoires simples indépendants. La variable étudiée doit se distribuer selon une loi normale dans chacune des trois souspopulations. La variable étudiée doit posséder la même variance dans chacune des trois sous-populations considérées (hypothèse d’homoscédasticité). On peut raisonnablement penser que cette dernière hypothèse est bien satisfaite, puisque les trois variances-échantillons ne présentent que de très faibles différences. /2 8. Décision et interprétation au niveau de 0,05. Réponse : On ne rejette pas l'hypothèse nulle. Les données ne permettent pas de conclure à l’existence d’une différence entre les performances moyennes des trois méthodes. /2 I2/Corrigé -3/4 - 9. La décision prise au point 8 est-elle compatible avec celles prises au point 4. Quelle conclusion doit-on finalement retenir . Commentez. Réponse : Le test t a permis de conclure à une différence significative entre les méthodes A et C ( au niveau de 5%). On retiendra pourtant la conclusion obtenue grâce à l'analyse de la variance à un facteur. Le test ONEWAY est le test le mieux indiqué lorsque l'on compare plus de deux moyennes. Il est vivement déconseillé de procéder à plusieurs tests t. En effet, si chaque test est effectué au niveau de 0,05, la probabilité de conclure erronément à une différence significative à l'un ou l'autre de ces trois tests (risque de première espèce) n'est pas 0,05. Elle est calculée par la formule 1 - (1 - α)c où c est le nombre de tests t effectués. En effet, le risque de 1èreespèce associé à l’ensemble des c tests = probabilité qu’au moins un des tests nous fasse commettre l’erreur de 1èreespèce = 1 - probabilité qu’aucun des c tests ne fasse commettre l’erreur de 1èreespèce = 1 - (1 - risque de 1èreespèce associé à un test donné)c = 1 - (1 - α)c Dans notre exemple, le risque de première espèce associé à l’ensemble des trois tests t vaut 1 (1 - 0,05)3 = 0,143, et est donc très nettement supérieur au niveau de 0,05 que nous nous étions fixé. /2 I2/Corrigé -4/4 -