partielPH2_correction

publicité
Université de Rouen
UFR de Médecine et Pharmacie
Année Universitaire 2014-2015
GFGSP 2
Epreuve de Statistiques
Mme Le Clézio
Date de l’épreuve : mercredi 7 janvier
Durée de l’épreuve : 1 heure
Session 1
Le sujet comporte 2 pages et se trouve accompagné d’un formulaire et des tables usuelles.
Consignes
• pour tous les tests, vous choisirez un risque α de 5%;
• tout autre document est interdit;
• la calculatrice est autorisée.
Questions de cours
Indiquez sur votre copie la(les) bonne(s) réponse(s) sous la forme : Question x, réponse y.
1. La région critique d’un test est construite de façon à garantir le contrôle :
(A) du risque de rejeter H0 à tort,
(B) du risque de rejeter H1 à tort.
2. Lorsque l’on souhaite comparer la moyenne d’une variable continue mesurée avant et après
un traitement chez les mêmes individus, on utilise :
(A) un test de comparaison des proportions,
(B) un test non paramétrique de Mann-Whitney/Wilcoxon pour échantillons indépendants,
(C) un test de Student de comparaison de moyennes pour données appariées,
(D) un test de Student de comparaison de moyennes pour échantillons indépendants.
1. A
2. C
Exercice 1
Un laboratoire souhaite comparer la qualité d’un nouveau kit enzymo-immunologique pour le
dosage d’un médicament, par comparaison au kit utilisé jusque-là en production. Un étalon est
constitué à partir de 12 dosages contrôles réalisés avec le kit usuel, sur des échantillons de plasma
surchargés à une concentration fixe. Le laboratoire mesure alors une concentration moyenne de
31,1 mg/L, pour une variance de 3,4 (mg/L)2 . Le nouveau kit est testé sur 12 dosages similaires.
1
Le laboratoire observe alors une concentration moyenne de 28,7 mg/L, avec une variance de 2,1
(mg/L)2 .
Au vu de ces mesures, le nouveau kit renvoit-il des mesures en moyenne comparables à
l’ancien?
1. Donnez l’intervalle de confiance à 95% de la concentration moyenne mesurée par chacun
des kits.
2. Définissez les hypothèses à tester.
3. Proposez une statistique de test permettant de répondre à la question.
4. Comment concluez-vous le test ?
On note µ1 (resp. µ2 ) l’espérance des mesures avec le premier kit (resp. le nouveau kit).
Intervalle de confiance à 95% pour chacun des kits
Pour chaque intervalle de confiance, on utilise le quantile à 97,5% (bilatéral) d’une loi de Student
à 11 ddl (n1 − 1 = n2 − 1 = 11), soit 2.201.
s
s2i
]
IC95% (µi ) = [mi ± t11,97,5%
ni
Soit :
r
3, 4
] = [29, 93 − 32, 27]
12
r
2, 1
] = [27, 78 − 29, 62]
12
IC95% (µ1 ) = [31, 1 ± t11,97,5%
IC95% (µ1 ) = [28, 7 ± t11,97,5%
Remarques
• Intervalle de confiance : toujours bilatéral
• Surtout pas de loi normale à cette taille d’échantillon
• On donne la variance dans le texte, pas l’écart-type.
Hypothèses à tester : Test de comparaison de deux espérances
indépendantes à variances inconnues et sur petits échantillons
(
H0 :
H1 :
Les mesures du nouveau kit ont la même espérance que celles de l’ancien.
Les mesures du nouveau kit n’ont pas la même espérance à celles de l’ancien.
(
H0 : µ1 = µ2
H1 : µ1 6= µ2
Remarques
• Pas de ”significatif” dans la formulation des hypothèses.
• Cohérence entre la formulation mathématique et la formulation en français.
• Attention aux notations et à leur définition
Statistique de test
On considère la statistique de test suivante :
m1 − m2
T =q
2
s × ( n11 +
1
n2 )
où s2 estime la variance commune :
s2 =
(n1 − 1)s21 + (n2 − 1)s22
11 × 3, 4 + 11 × 2, 1
=
= 2, 75
n1 + n2 − 2
22
31, 1 − 28, 7
tobs = q
= 3, 55
1
1
+ 12
)
2, 75 × ( 12
Remarques
• Attention au choix de la formule ! Variances inconnues
• Attention aux erreurs de calculs (somme de fractions)
Conclusion du test
La statistique de test T suit sous l’hypothèse nulle une loi de Student à n1 + n2 − 2 = 22 ddl,
donc on compare tobs au quantile à 97,5% d’une loi de Student à 22 ddl, soit 2,074. Comme
tobs > 2, 074, on rejette l’hypothèse nulle et on conclut que le nouveau kit donne des mesures
significativement plus faibles que l’ancien kit, au risque de 5%.
Remarques
• Attention au quantile, ce n’est pas le même que pour les intervalles de confiance !
• Préciser que la conclusion est au risque de 5%.
Exercice 2
Un étudiant en pharmacie est entrainé à mesurer la pression artérielle lors d’une journée de don
du sang. Pour chacun des 200 sujets considérés, son professeur vérifie à son tour la mesure.
Les mesures de pression diastolique de l’étudiant présentent une variance de 184 mmHg 2 . Les
mesures de son professeur présentent une variance de 133 mmHg 2 .
L’étudiant doit-il continuer à s’entraı̂ner ? Autrement dit, ses mesures sont-elles significativement plus variables que celles de son maı̂tre ?
On note σ1 (resp. σ2 ) la variance des mesures du maı̂tre (resp. de l’étudiant).
Hypothèses à tester : Test unilatéral à droite de comparaison de deux
variances
(
H0 : Les mesures de l’étudiant sont plus variables que celles du maı̂tre.
H1 : Les mesures de l’étudiant ne sont pas plus variables que celles du maı̂tre.
(
H0 : σ1 = σ2
H1 : σ1 < σ2
Remarques
• Pas de ”significatif” dans la formulation des hypothèses.
• Cohérence entre la formulation mathématique et la formulation en français.
• Les mesures du maı̂tre sont estimées dans les mêmes conditions que celles de l’étudiant, il
ne s’agit pas d’une comparaison à une norme.
Statistique de test
On considère la statistique de test suivante :
F =
fobs =
s22
s21
184
= 1, 38
133
Remarques
• On veut savoir si σ2 est supérieur à σ1 donc s2 est au numérateur.
• L’énoncé donne directement les variances.
Conclusion du test
La statistique de test F suit sous l’hypothèse nulle une loi de Fisher à n1 − 1 et n2 − 1 ddl, soit
199 et 199 ddl. Dans la table, on prend le plus proche, soit ∞ et 100, ce qui donne un quantile
à 95% de 1,303. Comme fobs > 1, 303, on rejette l’hypothèse nulle et on conclut que le nouvel
étudiant doit continuer à s’entraı̂ner, au risque de 5%.
Remarques
• Pas de problème s’ils choisissent 100 et 100 ddl, pour un quantile de 1,407 et non rejet de
H0.
Exercice 3
Une expérience a été menée pour explorer le lien entre la fréquence cardiaque d’une personne et
la fréquence à laquelle on lui demande de monter et descendre des escaliers.
On effectue une régression linéaire de la fréquence cardiaque après effort sur la fréquence
cardiaque au repos et la fréquence des pas comme variable catégorielle (lentement ou 14 pas/min,
modérément ou 21 pas/min, rapidement ou 28 pas/min).
On obtient les résultats suivants, le logiciel précisant que le R2 associé à cette régression
linéaire est de 0.61.
Variable
Ordonnée à l’origine
Fréquence cardiaque au repos
Pas modérés
Pas rapides
Coefficient
-2,6
1,2
7,7
27,8
Ecart-type
22,2
0,3
6,0
6,0
t
-0,1
4,5
1,3
4,6
p-valeur
0,9062
0,0001
0,2143
9,29e-05
Répondez par vrai ou faux, en justifiant vos réponses à partir des valeurs ci-dessus dès que
possible.
(A) La catégorie ”pas lents” est utilisée comme catégorie de référence.
(B) Les catégories ”pas modérés” et ”pas rapides” sont utilisées comme catégories de référence.
(C) La fréquence cardiaque après effort dépend significativement de la fréquence cardiaque au
repos, au risque de 5%.
(D) Quelle quelle soit, la fréquence des pas influe significativement la fréquence cardiaque après
effort, au risque de 5%.
(E) Une fréquence rapide des pas augmente en moyenne le rythme cardiaque de 27.8 battements
par minute par rapport aux pas lents.
(F) Une fréquence modérée des pas augmente significativement le rythme cardiaque par rapport aux pas lents, au risque de 5%.
(G) Les personnes montant les marches lentement présentent en moyenne une fréquence cardiaque après effort à peu près égale à 1.2 fois leur fréquence cardiaque au repos.
(H) Cette régression linéaire explique plus de la moitié de la variabilité de la fréquence cardiaque
après effort.
(A) Vrai, c’est la seule catégorie pour laquelle il n’y a pas de coefficient.
(B) Faux, pour la raison inverse.
(C) Vrai, la p-valeur est de 0,0001 < 5%.
(D) Faux, ce n’est pas le cas des pas modérés par rapport aux pas lents.
(E) Vrai, coefficient pas rapides vs pas lents de 27,8 battements, avec p-valeur < 5%.
(F) Faux, p-valeur de 0, 21 > 5%.
(G) Vrai, coefficient de la fréquence cardiaque au repos de 1,2 et ordonnée à l’origine non
significative (p-valeur = 0, 90 > 5%).
(H) Vrai, le R2 vaut 61%.
Téléchargement