Université de Rouen UFR de Médecine et Pharmacie Année Universitaire 2014-2015 GFGSP 2 Epreuve de Statistiques Mme Le Clézio Date de l’épreuve : mercredi 7 janvier Durée de l’épreuve : 1 heure Session 1 Le sujet comporte 2 pages et se trouve accompagné d’un formulaire et des tables usuelles. Consignes • pour tous les tests, vous choisirez un risque α de 5%; • tout autre document est interdit; • la calculatrice est autorisée. Questions de cours Indiquez sur votre copie la(les) bonne(s) réponse(s) sous la forme : Question x, réponse y. 1. La région critique d’un test est construite de façon à garantir le contrôle : (A) du risque de rejeter H0 à tort, (B) du risque de rejeter H1 à tort. 2. Lorsque l’on souhaite comparer la moyenne d’une variable continue mesurée avant et après un traitement chez les mêmes individus, on utilise : (A) un test de comparaison des proportions, (B) un test non paramétrique de Mann-Whitney/Wilcoxon pour échantillons indépendants, (C) un test de Student de comparaison de moyennes pour données appariées, (D) un test de Student de comparaison de moyennes pour échantillons indépendants. 1. A 2. C Exercice 1 Un laboratoire souhaite comparer la qualité d’un nouveau kit enzymo-immunologique pour le dosage d’un médicament, par comparaison au kit utilisé jusque-là en production. Un étalon est constitué à partir de 12 dosages contrôles réalisés avec le kit usuel, sur des échantillons de plasma surchargés à une concentration fixe. Le laboratoire mesure alors une concentration moyenne de 31,1 mg/L, pour une variance de 3,4 (mg/L)2 . Le nouveau kit est testé sur 12 dosages similaires. 1 Le laboratoire observe alors une concentration moyenne de 28,7 mg/L, avec une variance de 2,1 (mg/L)2 . Au vu de ces mesures, le nouveau kit renvoit-il des mesures en moyenne comparables à l’ancien? 1. Donnez l’intervalle de confiance à 95% de la concentration moyenne mesurée par chacun des kits. 2. Définissez les hypothèses à tester. 3. Proposez une statistique de test permettant de répondre à la question. 4. Comment concluez-vous le test ? On note µ1 (resp. µ2 ) l’espérance des mesures avec le premier kit (resp. le nouveau kit). Intervalle de confiance à 95% pour chacun des kits Pour chaque intervalle de confiance, on utilise le quantile à 97,5% (bilatéral) d’une loi de Student à 11 ddl (n1 − 1 = n2 − 1 = 11), soit 2.201. s s2i ] IC95% (µi ) = [mi ± t11,97,5% ni Soit : r 3, 4 ] = [29, 93 − 32, 27] 12 r 2, 1 ] = [27, 78 − 29, 62] 12 IC95% (µ1 ) = [31, 1 ± t11,97,5% IC95% (µ1 ) = [28, 7 ± t11,97,5% Remarques • Intervalle de confiance : toujours bilatéral • Surtout pas de loi normale à cette taille d’échantillon • On donne la variance dans le texte, pas l’écart-type. Hypothèses à tester : Test de comparaison de deux espérances indépendantes à variances inconnues et sur petits échantillons ( H0 : H1 : Les mesures du nouveau kit ont la même espérance que celles de l’ancien. Les mesures du nouveau kit n’ont pas la même espérance à celles de l’ancien. ( H0 : µ1 = µ2 H1 : µ1 6= µ2 Remarques • Pas de ”significatif” dans la formulation des hypothèses. • Cohérence entre la formulation mathématique et la formulation en français. • Attention aux notations et à leur définition Statistique de test On considère la statistique de test suivante : m1 − m2 T =q 2 s × ( n11 + 1 n2 ) où s2 estime la variance commune : s2 = (n1 − 1)s21 + (n2 − 1)s22 11 × 3, 4 + 11 × 2, 1 = = 2, 75 n1 + n2 − 2 22 31, 1 − 28, 7 tobs = q = 3, 55 1 1 + 12 ) 2, 75 × ( 12 Remarques • Attention au choix de la formule ! Variances inconnues • Attention aux erreurs de calculs (somme de fractions) Conclusion du test La statistique de test T suit sous l’hypothèse nulle une loi de Student à n1 + n2 − 2 = 22 ddl, donc on compare tobs au quantile à 97,5% d’une loi de Student à 22 ddl, soit 2,074. Comme tobs > 2, 074, on rejette l’hypothèse nulle et on conclut que le nouveau kit donne des mesures significativement plus faibles que l’ancien kit, au risque de 5%. Remarques • Attention au quantile, ce n’est pas le même que pour les intervalles de confiance ! • Préciser que la conclusion est au risque de 5%. Exercice 2 Un étudiant en pharmacie est entrainé à mesurer la pression artérielle lors d’une journée de don du sang. Pour chacun des 200 sujets considérés, son professeur vérifie à son tour la mesure. Les mesures de pression diastolique de l’étudiant présentent une variance de 184 mmHg 2 . Les mesures de son professeur présentent une variance de 133 mmHg 2 . L’étudiant doit-il continuer à s’entraı̂ner ? Autrement dit, ses mesures sont-elles significativement plus variables que celles de son maı̂tre ? On note σ1 (resp. σ2 ) la variance des mesures du maı̂tre (resp. de l’étudiant). Hypothèses à tester : Test unilatéral à droite de comparaison de deux variances ( H0 : Les mesures de l’étudiant sont plus variables que celles du maı̂tre. H1 : Les mesures de l’étudiant ne sont pas plus variables que celles du maı̂tre. ( H0 : σ1 = σ2 H1 : σ1 < σ2 Remarques • Pas de ”significatif” dans la formulation des hypothèses. • Cohérence entre la formulation mathématique et la formulation en français. • Les mesures du maı̂tre sont estimées dans les mêmes conditions que celles de l’étudiant, il ne s’agit pas d’une comparaison à une norme. Statistique de test On considère la statistique de test suivante : F = fobs = s22 s21 184 = 1, 38 133 Remarques • On veut savoir si σ2 est supérieur à σ1 donc s2 est au numérateur. • L’énoncé donne directement les variances. Conclusion du test La statistique de test F suit sous l’hypothèse nulle une loi de Fisher à n1 − 1 et n2 − 1 ddl, soit 199 et 199 ddl. Dans la table, on prend le plus proche, soit ∞ et 100, ce qui donne un quantile à 95% de 1,303. Comme fobs > 1, 303, on rejette l’hypothèse nulle et on conclut que le nouvel étudiant doit continuer à s’entraı̂ner, au risque de 5%. Remarques • Pas de problème s’ils choisissent 100 et 100 ddl, pour un quantile de 1,407 et non rejet de H0. Exercice 3 Une expérience a été menée pour explorer le lien entre la fréquence cardiaque d’une personne et la fréquence à laquelle on lui demande de monter et descendre des escaliers. On effectue une régression linéaire de la fréquence cardiaque après effort sur la fréquence cardiaque au repos et la fréquence des pas comme variable catégorielle (lentement ou 14 pas/min, modérément ou 21 pas/min, rapidement ou 28 pas/min). On obtient les résultats suivants, le logiciel précisant que le R2 associé à cette régression linéaire est de 0.61. Variable Ordonnée à l’origine Fréquence cardiaque au repos Pas modérés Pas rapides Coefficient -2,6 1,2 7,7 27,8 Ecart-type 22,2 0,3 6,0 6,0 t -0,1 4,5 1,3 4,6 p-valeur 0,9062 0,0001 0,2143 9,29e-05 Répondez par vrai ou faux, en justifiant vos réponses à partir des valeurs ci-dessus dès que possible. (A) La catégorie ”pas lents” est utilisée comme catégorie de référence. (B) Les catégories ”pas modérés” et ”pas rapides” sont utilisées comme catégories de référence. (C) La fréquence cardiaque après effort dépend significativement de la fréquence cardiaque au repos, au risque de 5%. (D) Quelle quelle soit, la fréquence des pas influe significativement la fréquence cardiaque après effort, au risque de 5%. (E) Une fréquence rapide des pas augmente en moyenne le rythme cardiaque de 27.8 battements par minute par rapport aux pas lents. (F) Une fréquence modérée des pas augmente significativement le rythme cardiaque par rapport aux pas lents, au risque de 5%. (G) Les personnes montant les marches lentement présentent en moyenne une fréquence cardiaque après effort à peu près égale à 1.2 fois leur fréquence cardiaque au repos. (H) Cette régression linéaire explique plus de la moitié de la variabilité de la fréquence cardiaque après effort. (A) Vrai, c’est la seule catégorie pour laquelle il n’y a pas de coefficient. (B) Faux, pour la raison inverse. (C) Vrai, la p-valeur est de 0,0001 < 5%. (D) Faux, ce n’est pas le cas des pas modérés par rapport aux pas lents. (E) Vrai, coefficient pas rapides vs pas lents de 27,8 battements, avec p-valeur < 5%. (F) Faux, p-valeur de 0, 21 > 5%. (G) Vrai, coefficient de la fréquence cardiaque au repos de 1,2 et ordonnée à l’origine non significative (p-valeur = 0, 90 > 5%). (H) Vrai, le R2 vaut 61%.