Principe des tests statistiques

publicité
Principe des tests statistiques :
Application à la comparaison d’une moyenne
à une valeur de référence
M-A Dronne
2016 - 2017
1 / 57
Introduction
Remarques préliminaires
I
Etablir un plan d’expérience et prévoir l’analyse
statistique avant de faire les expériences
I
Déterminer le test statistique (= test d’hypothèse) en
fonction de :
I
I
I
I
Question posée
Variables (nombre, type)
Données (nombre d’échantillons et propriétés des
données)
Bien différencier "population" et "échantillon" :
I
I
La question statistique posée concerne une (ou plusieurs)
population(s)
Les données disponibles proviennent d’un (ou de plusieurs)
échantillon(s) issu(s) de cette(ces) population(s) et
représentatif(s) de cette (ces) populations (méthodes
d’échantillonnage)
2 / 57
Introduction
Types de tests statistiques
On distingue classiquement :
I
Tests univariés/multivariés
⇒ dépend du nombre de variables prises en compte
I
Tests paramétriques/non paramétriques
⇒ dépend des propriétés des données et des conditions
d’application des tests
Plan du cours
I
Démarche générale : principales étapes
I
Application au test de comparaison d’une moyenne à
une valeur de référence :
1. Cas bilatéral, grand échantillon
2. Cas unilatéral, grand échantillon
3. Cas bilatéral, petit échantillon
3 / 57
Exemple de problème
Contexte
On considère la population des patients hypertendus (dont la
moyenne théorique de la pression artérielle systolique (PAS)
vaut 154.5 mm Hg). On souhaite étudier l’effet d’un nouveau
médicament A sur la PAS de cette population. Pour cela, on
constitue un groupe de 50 patients hypertendus et on mesure
la PAS de chacun de ces patients après l’administration de ce
médicament.
Le médicament A a-t-il un effet sur la PAS des hypertendus ?
Question en langage statistique
La moyenne de la PAS de la population des hypertendus après
l’administration du médicament A est-elle significativement
différente de la valeur de référence de la PAS des hypertendus
au risque α ?
⇒ Comparaison d’une moyenne à une valeur de référence
4 / 57
Démarche générale
Principales étapes
1. Question statistique (variables et hypothèses statistiques)
2. Etude des données (propriétés et calculs)
3. Choix du test (tests préliminaires)
4. Statistique de test (formule et calcul)
5. Confrontation (décision statistique)
6. Conclusion du test
5 / 57
Démarche générale
Principales étapes
1. Question statistique (variables et hypothèses statistiques)
2. Etude des données (propriétés et calculs)
3. Choix du test (tests préliminaires)
4. Statistique de test (formule et calcul)
5. Confrontation (décision statistique)
6. Conclusion du test
6 / 57
Question statistique
Variables étudiées
Caractéristiques des variables
I
I
Variable(s) étudiée(s)
Type de variable
I
I
qualitative
quantitative (discrète / continue)
Exemple
I
1 variable : X : PAS après administration du médicament A
I
variable quantitative, continue
7 / 57
Question statistique
Hypothèses statistiques
Hypothèse nulle
I
Hypothèses nulle = H0
I
H0 traduit le plus souvent une égalité
I
H0 s’adresse toujours à la population (pas à l’échantillon)
Hypothèse alternative
I
I
Hypothèses alternative = H1
H1 traduit le plus souvent une différence ou une inégalité
I
I
Différence (6=) ⇒ test bilatéral
Inégalité (< ou >) ⇒ test unilatéral (gauche ou droit)
I
H1 s’adresse toujours à la population (pas à l’échantillon)
I
H1 est fixée a priori et ne peut pas être modifiée a
posteriori
8 / 57
Question statistique
Hypothèses statistiques
Exemple
Dans cette partie, on considère que l’on n’a pas d’a priori sur
l’effet du médicament A sur la PAS et qu’il peut potentiellement
aussi bien diminuer qu’augmenter la PAS chez les patients
hypertendus.
I
H0 : égalité de la moyenne de la PAS des hypertendus
avec le médicament A et de la moyenne théorique de la
PAS des hypertendus.
H 0 : µ = µ0
I
H1 : différence des deux moyennes ⇒ test bilatéral
H1 : µ 6= µ0
9 / 57
Question statistique
Remarques sur les risques
Risque α
I
I
Risque α = risque de 1ère espèce = erreur de 1ère espèce
Doit être fixé avant de faire le test :
I
I
Soit donné dans l’énoncé
Soit fixé arbitrairement (souvent à 5%)
I
Probabilité de rejeter H0 quand H0 est vraie :
α = P(RH0 /H0 )
I
Probabilité contraire : probabilité d’accepter H0 quand H0
est vraie :
1 − α = P(AH0 /H0 ) ⇒ confiance
Exemple
On prend ici α = 5%
10 / 57
Question statistique
Remarques sur les risques
Risque β
I
Risque β = risque de 2ème espèce = erreur de 2ème espèce
I
Calcul possible a posteriori (mais souvent difficile)
I
Probabilité d’accepter H0 quand H1 est vraie :
β = P(AH0 /H1 )
I
Probabilité contraire : probabilité de rejeter H0 quand H1
est vraie :
1 − β = P(RH0 /H1 ) ⇒ puissance
Remarques
I
Plus α est petit, plus β est grand et inversement.
I
Plus la taille de l’échantillon (n) est petite, plus β est grand
I
Dans les essais cliniques, on calcule le nombre de sujets
nécessaires (n) pour avoir une puissance (1 − β)
suffisante.
11 / 57
Question statistique
Remarques sur les risques
Résumé
Décision test
H0 acceptée
H0 rejetée
Réalité
H0 vraie
H1 vraie
confiance
risque β
risque α puissance
Remarque
On se positionne toujours par rapport à H0
I
On ne dit jamais que l’on accepte H1 ou que l’on rejette H1
I
On dit que l’on rejette H0 ou que l’on ne rejette pas (= que
l’on accepte) H0
12 / 57
Démarche générale
Principales étapes
1. Question statistique (variables et hypothèses statistiques)
2. Etude des données (propriétés et calculs)
3. Choix du test (tests préliminaires)
4. Statistique de test (formule et calcul)
5. Confrontation (décision statistique)
6. Conclusion du test
13 / 57
Etude des données
Propriétés
Propriétés des données
I
Nombre d’échantillons
I
Taille de(s) échantillon(s)
I
Données appariées ou indépendantes (quand plusieurs
échantillons)
Exemple
I
1 échantillon
I
n = 50 (> 30) ⇒ grand échantillon
14 / 57
Etude des données
Calculs
Calcul des paramètres statistiques d’intérêt
I
Paramètres : moyennes, variances (et écart-types),
pourcentages,...
I
Calculs de leurs valeurs estimées dans la population à
partir des données de l’échantillon ⇒ estimations
Cas de la comparaison d’une moyenne à une valeur
de référence
Calcul des paramètres estimés suivants :
P
x
I Moyenne estimée : m =
n
r
SCE
I Ecart-type estimé : s =
n−1
15 / 57
Etude des données
Calculs
Exemple
Calculs des valeurs estimées de la moyenne et de l’écart-type
de la population à partir des 50 données de PAS de
l’échantillon :
I
m = 150.5 mm Hg
I
s = 11.44 mm Hg
16 / 57
Démarche générale
Principales étapes
1. Question statistique (variables et hypothèses statistiques)
2. Etude des données (propriétés et calculs)
3. Choix du test (tests préliminaires)
4. Statistique de test (formule et calcul)
5. Confrontation (décision statistique)
6. Conclusion du test
17 / 57
Choix du test
Test paramétrique / non paramétrique
Tests paramétriques
I
Définition : tests qui reposent sur des hypothèses
concernant les distributions des variables étudiées.
I
Avantage : tests puissants
I
Problème : hypothèses contraignantes (normalité,
homoscédasticité (= égalité des variances))
Tests non paramétriques
I
Définition : tests qui ne prennent pas en compte la
distribution des variables
I
Avantage : pas de contrainte ou faibles contraintes
(applicables aux très petits échantillons et quand absence
de normalité et/ou hétéroscédasticité)
I
Problème : tests moins puissants (mais plus robustes)
18 / 57
Choix du test
Test paramétrique / non paramétrique
Conditions
Choix d’un test paramétrique dans les conditions suivantes :
I
Grand(s) échantillon(s)
I
Petit(s) échantillon(s) mais avec certaines propriétés.
Exemples :
I
I
Normalité (de la distribution) des variables
Homoscédasticité = homogénéité des variances = égalité
des variances
Tests préliminaires pour vérifier ces propriétés
I
Test de normalité
I
Test de comparaison de variances
19 / 57
Choix du test
Critères de choix
I
Caractéristiques des données (taille de l’échantillon,
données appariées/indépendantes,...)
I
Résultats des tests préliminaires (normalité,
homoscédasticité,...)
⇒ Détermination du test le mieux adapté pour répondre à la
question posée
Exemple
I
Données : 1 grand échantillon ⇒ utilisation du TLC
(Théorème de la Limite Centrée) ⇒ normalité de la
(distribution de la) moyenne empirique de la variable ⇒
pas nécessaire de faire des tests préliminaires
I
Test retenu : test paramétrique de comparaison d’une
moyenne à une valeur de référence, dans le cas bilatéral
et avec grand échantillon.
20 / 57
Démarche générale
Principales étapes
1. Question statistique (variables et hypothèses statistiques)
2. Etude des données (propriétés et calculs)
3. Choix du test (tests préliminaires)
4. Statistique de test (formule et calcul)
5. Confrontation (décision statistique)
6. Conclusion du test
21 / 57
Statistique de test
Formule et loi
Remarques
I
Statistique de test = variable de décision = fonction
discriminante
I
Statistique de test : variable aléatoire (le plus souvent
centrée réduite)
I
Détermination de la formule sous H0 (= quand H0 est
vraie)
I
Détermination de la loi suivie par la statistique de test sous
H0 (à partir de la loi suivie par la variable étudiée)
I
Notation :
I
I
I
I
Cas général : Z
Si elle suit une loi normale : U
Si elle suit une loi de Student : T
Si elle suit une loi de Fisher : F ,...
22 / 57
Statistique de test
Formule et loi
Exemple
I
Variable étudiée : M : estimateur de la moyenne
I
Loi suivie par M (sous H0 ) : loi normale :
σ
M → N µ0 , √
n
I
Statistique de test (sous H0 ) : Z =
I
Loi suivie par Z (sous H0 ) : loi normale centrée réduite :
M − µ0
√σ
n
Z → N(0, 1)
I
Remarque : on peut noter U au lieu de Z
23 / 57
Statistique de test
Calcul
Calcul de la valeur de la statistique de test
I
I
2 cas :
I
Valeurs théoriques des paramètres connues
⇒ utilisation de ces valeurs dans le calcul
I
Valeurs théoriques des paramètres inconnues
⇒ remplacement par les estimations calculées
précédemment à partir des données des échantillons
Notation : minuscule (z, u, t,...)
Remarque
Dans le cadre de ce cours et de celui sur les tests
paramétriques, on s’intéressera au cas où la valeur théorique σ
n’est pas connue (cas habituel en pratique).
24 / 57
Statistique de test
Calcul
Exemple
Dans l’expression : Z = U =
M − µ0
√σ
n
, on remplace :
I
M par la moyenne estimée : m = 150.5
I
σ par l’écart-type estimé : s = 11.44
On obtient alors la valeur calculée de la statistique de test :
z=u=
m − µ0
√s
n
=
150.5 − 154.5
11.44
√
50
⇒ u ' −2.47
25 / 57
Démarche générale
Principales étapes
1. Question statistique (variables et hypothèses statistiques)
2. Etude des données (propriétés et calculs)
3. Choix du test (tests préliminaires)
4. Statistique de test (formule et calcul)
5. Confrontation (décision statistique)
6. Conclusion du test
26 / 57
Confrontation
Généralités
3 façons pour arriver à la conclusion
I
Utilisation d’une valeur seuil lue dans une table
⇒ Comparaison de la valeur calculée de la statistique de
test à une valeur seuil lue dans une table de distribution
(table de l’écart-réduit, table de Student,...)
I
Utilisation de l’intervalle d’acceptation
⇒ Position de la valeur calculée de la statistique de test
par rapport à l’intervalle d’acceptation (de H0 )
I
Utilisation de la p-value
⇒ Comparaison de la p-value au risque α préalablement
choisi
27 / 57
Confrontation
Utilisation d’une valeur seuil lue dans une table
Etapes
I
Table de la loi suivie par la statistique de test sous H0
I
Lecture de la valeur seuil obtenue pour le risque α ⇒ zs
(toujours positive)
I
Comparaison de cette valeur seuil à la valeur de la
statistique de test :
I
I
Si |z| < zs ⇒ non rejet de H0 au risque α
Si |z| ≥ zs ⇒ rejet de H0 au risque α
Exemple
I
Z = U → N(0, 1) ⇒ table de l’écart-réduit
I
Valeur seuil lue dans la table pour α = 5% ⇒ us = 1.96
I
Comme 2.47 ≥ 1.96 ⇒ |z| ≥ zs ⇒ rejet de H0 au risque
α = 5%
28 / 57
Confrontation
Utilisation d’une valeur seuil lue dans une table
Remarque
Pour lire la valeur seuil zs dans la table, il faut tenir compte :
I
I
Du test : unilatéral ou bilatéral
De la table : unilatérale ou bilatérale
I
I
Table bilatérale : table de l’écart-réduit (loi normale), table
de Student,...
Table unilatérale : table de Fisher, table du Chi-Deux,...
La valeur zs = zαtable se lit pour αtable qui vaut :
Table bilatérale
Table unilatérale
Test bilatéral
α
α
2
Test unilatéral
2α
α
29 / 57
Confrontation
Utilisation de l’intervalle d’acceptation
Etapes
I
Table de la loi suivie par la statistique de test sous H0 et
lecture de la valeur seuil obtenue pour le risque α ⇒ zs
I
Intervalle d’acceptation de H0 ⇒ Ia =] − zs ; zs [
I
Position de la valeur de la statistique de test par rapport à
cet intervalle :
I
I
Si z ∈ Ia ⇒ non rejet de H0 au risque α
Si z ∈
/ Ia ⇒ rejet de H0 au risque α
Exemple
I
Valeur seuil lue dans la table de l’écart-réduit pour
α = 5% ⇒ us = 1.96
I
Ia =] − 1.96; 1.96[
I
Comme us = −2.47 ∈
/ Ia ⇒ rejet de H0 au risque α = 5%
30 / 57
Confrontation
Utilisation de la p-value
Définitions
I
p-value = probabilité critique = degré de signification =
"petit p"
I
p − value : probabilité d’observer une valeur au moins
aussi grande que la valeur observée z sous H0 :
p − value = P(Z ≤ −|z|/H0 ) + P(Z ≥ |z|/H0 )
⇒ la p − value représente la "crédibilité" de H0
I
Rappel : α : probabilité de rejeter H0 quand H0 est vraie :
α = P(RH0 /H0 ) = P(Z ≤ −zs /H0 ) + P(Z ≥ zs /H0 )
31 / 57
Confrontation
Utilisation de la p − value
Etapes
I
I
Détermination de la valeur de la p − value (par le calcul ou
par un logiciel de statistique)
Comparaison de la p − value et du risque de 1ère espèce :
I
I
Si p − value > α ⇒ non rejet de H0 au risque α
Si p − value ≤ α ⇒ rejet de H0 au risque α
Exemple
I
Calcul de probabilité (en utilisant la table de l’écart-réduit) :
p − value = P(Z ≤ −2.47) + P(Z ≥ 2.47)
I
Lecture de la p − value sur R : p − value = 0.017
I
Comme p − value ≤ 0.05 ⇒ rejet de H0 au risque α = 5%
32 / 57
Démarche générale
Principales étapes
1. Question statistique (variables et hypothèses statistiques)
2. Etude des données (propriétés et calculs)
3. Choix du test (tests préliminaires)
4. Statistique de test (formule et calcul)
5. Confrontation (décision statistique)
6. Conclusion du test
33 / 57
Conclusion du test
Non rejet de H0 au risque α
I
Langage statistique
⇒ Pas de différence significative de la moyenne de la
grandeur mesurée dans la population d’étude d’avec la
valeur théorique, au risque α
I
Langage courant
⇒ Absence d’effet significatif du facteur étudié, au risque α
Rejet de H0 au risque α
I
Langage statistique
⇒ Différence significative de la moyenne de la grandeur
mesurée dans la population d’étude d’avec la valeur
théorique, au risque α
I
Langage courant
⇒ Effet significatif du facteur étudié, au risque α
34 / 57
Conclusion du test
Exemple
I
Langage statistique
⇒ Différence significative de la moyenne de la PAS des
hypertendus après administration du médicament A d’avec
la moyenne théorique de PAS des hypertendus, au risque
α = 5%
I
Langage courant
⇒ Effet significatif du médicament A sur la PAS, au risque
α = 5%
35 / 57
Conclusion du test
Remarques
I
On dit parfois que le test est "significatif" quand il a montré
une différence significative (entre une moyenne et une
valeur de référence par exemple).
I
Lorsque le test a montré une différence significative, il est
d’usage de donner un ordre de grandeur de la p − value
(en puissance de 10).
Exemple
Effet significatif du médicament A sur la PAS, au risque α = 5%
(p − value = 10−2 )
36 / 57
Utilisation du logiciel R
Commande R
t.test(data, alternative=’two.sided’, mu=154.5, conf.level=.95)
I
data : fichier de données (50 valeurs de PAS)
I
alternative : hypothèse H1
I
mu = : valeur de référence
I
conf.level : niveau de confiance (0,95 pour un risque
α = 5%)
Remarque
Dans les logiciels de statistique, on utilise habituellement le
t-test (= test t = test de Student) car, lorsque les échantillons
sont grands, la loi normale et la loi de Student sont
équivalentes.
37 / 57
Utilisation du logiciel R
Résultats obtenus sur R
One Sample t-test
data: data
t = -2.4725, df = 49, p-value = 0.01694
alternative hypothesis: true mean is not equal to
154.5
95 percent confidence interval:
147.2489 153.7511
sample estimates:
mean of x
150.5
38 / 57
Autres tests de comparaison d’une moyenne à une
valeur de référence
Différents cas
I
Cas vu précédemment :
Cas bilatéral dans le cas d’un grand échantillon
I
Autres cas :
I
I
Cas unilatéral
Cas d’un petit échantillon
39 / 57
Autres tests de comparaison d’une moyenne à une
valeur de référence
Différents cas
I
Cas vu précédemment :
Cas bilatéral dans le cas d’un grand échantillon
I
Autres cas :
I
I
Cas unilatéral
Cas d’un petit échantillon
40 / 57
Test unilatéral
Exemple
Nouvel énoncé
On reprend l’exemple précédent en considérant que l’on a un a
priori sur l’effet du médicament A : soit il n’a pas d’effet soit il
diminue la PAS des hypertendus. Dans ce cas, il faut considérer
un test unilatéral (toujours dans le cas grand échantillon).
⇒ Nouvelle étude
41 / 57
Test unilatéral
Différentes étapes
Hypothèse H1
Cas bilatéral
Cas unilatéral droit (= risque à droite)
Cas unilatéral gauche (= risque à gauche)
µ 6= µ0
µ > µ0
µ < µ0
Confrontation avec la valeur seuil lue dans la table de
l’écart-réduit
Cas bilatéral
Cas unilatéral (droit ou gauche)
zs = zα
zs = z2α
⇒ comparaison de la valeur calculée z avec la valeur seuil zs
42 / 57
Test unilatéral
Différentes étapes
Confrontation avec l’Ia
Cas bilatéral
Cas unilatéral droit
Cas unilatéral gauche
Ia =] − zα ; zα [
Ia =] − ∞; z2α [
Ia =] − z2α ; +∞[
⇒ position de la valeur calculée z par rapport à l’Ia
Confrontation avec la p − value (notée p)
Cas bilatéral
Cas unilatéral droit
Cas unilatéral gauche
p = P(Z ≤ −|z|) + P(Z ≥ +|z|)
p = P(Z ≥ z)
p = P(Z ≤ z)
⇒ comparaison de la p − value et du risque α
43 / 57
Test unilatéral
Exemple
Hypothèses
I
H0 : µ = µ0
I
H1 : µ < µ0
⇒ test unilatéral gauche (= risque à gauche)
Confrontation
I
Valeur calculée : z = −2.47
I
Valeur seuil (table de l’écart-réduit) :
zs = z2α = z0.1 = 1.645 (< 2.47)
I
Ia =] − z2α ; +∞[=] − 1.645; +∞[
I
p − value = P(Z ≤ z) = P(Z ≤ −2.47) = 0.0085 (< 0.05)
⇒ rejet de H0 au risque α = 5%
44 / 57
Test unilatéral
Exemple
Conclusion
I
Langage statistique
⇒ Diminution significative de la moyenne de la PAS des
hypertendus après administration du médicament A d’avec
la valeur théorique de PAS des hypertendus, au risque
α = 5%
I
Langage courant
⇒ Effet anti-hypertenseur significatif du médicament A sur
la PAS, au risque α = 5%
Remarque
Un test unilatéral est toujours plus puissant qu’un test bilatéral.
45 / 57
Test unilatéral
Utilisation du logiciel R
Commande R
t.test(data, alternative=’less’, mu=154.5, conf.level=.95)
Résultats obtenus sur R
One Sample t-test
data: data
t = -2.4725, df = 49, p-value = 0.008469
alternative hypothesis: true mean is less than
154.5
95 percent confidence interval:
-Inf 153.2124
sample estimates:
mean of x
150.5
46 / 57
Autres tests de comparaison d’une moyenne à une
valeur de référence
Différents cas
I
Cas vu précédemment :
Cas bilatéral dans le cas d’un grand échantillon
I
Autres cas :
I
I
Cas unilatéral
Cas d’un petit échantillon
47 / 57
Test sur un petit échantillon
Exemple
Nouvel énoncé
On reprend l’exemple initial en considérant que l’on a un
échantillon de seulement 15 patients hypertendus auxquels on
administre le médicament A. On souhaite savoir si ce
médicament a un effet (positif ou négatif) sur la PAS des
hypertendus. Dans ce cas, on considère un test (bilatéral) dans
le cas petit échantillon (< 30)
⇒ Nouvelle étude
48 / 57
Test sur un petit échantillon
Différentes étapes
Position du problème
Comme l’échantillon est petit (< 30), on ne peut pas utiliser le
TLC et considérer que la moyenne suit nécessairement une loi
normale. Pour savoir si la moyenne suit une loi normale ou non,
il faut regarder si la variable suit une loi normale et donc faire
un test de normalité sur les données
Visualisation graphique des données : commandes R
I
Histogramme de la distribution
⇒ fonction hist
I
Graphe quantile-quantile (= normal q-q plot) :
I
I
I
fonction qqnorm
fonction qqline (droite passant par les 1er et 3ème
quartiles)
fonction qqPlot du package car
49 / 57
Test sur un petit échantillon
Différentes étapes
Tests de normalité : commandes R
I
Test de Shapiro-Wilk
⇒ fonction shapiro.test
I
Test de Lilliefors (variante du test de
Kolmogorov-Smirnov)
⇒ fonction lillie.test du package nortest
Choix du test
I
Si la variable est normale
⇒ test paramétrique de comparaison de moyennes
I
Si la variable n’est pas normale
⇒ test non paramétrique de comparaison de moyennes
50 / 57
Test sur un petit échantillon
Différentes étapes
Cas paramétrique
I
Formule de la statistique de test (sous H0) :
Z =T =
M − µ0
S
√
n
→ Student à ν = n − 1 ddl
S : estimateur de l’écart-type
I
Valeur calculée :
z=t =
m − µ0
√s
n
51 / 57
Test sur un petit échantillon
Synthèse
Test de comparaison d’une moyenne à une valeur de
référence
1
Grand échantillon
Petit échantillon
( n ≥ 30 )
(n < 30)
X → N( µ,σ )
X → L quelconque
Statistique du test : U
Statistique du test : T
Sous H0 :
Sous H0 :
U=
M − µ0
→ N(0,1)
σ n
u=
m − µ0
s n
T=
Tests non
paramétriques
M − µ0
→ Student à ν = n − 1 ddl
S n
t=
m − µ0
s
n
52 / 57
Test sur un petit échantillon
Utilisation du logiciel R
Visualisation des données
I
hist(data, scale="frequency")
I
qqPlot(data, dist="norm")
I
qqnorm(data)
4
3
2
1
0
frequency
5
6
7
Résultats obtenus sur R : histogramme
130
140
150
160
170
180
comp_moy_theo_petit$valeurs
53 / 57
Test sur un petit échantillon
Utilisation du logiciel R
Résultats obtenus sur R : qqplot
Normal Q−Q Plot
170
170
●
●
●
●
●
●
●
●
●
130
●
●
−1
0
norm quantiles
1
●
●
●
●
●
140
140
●
160
●
●
150
150
●
●
●
Sample Quantiles
160
●
130
comp_moy_theo_petit$valeurs
●
●
●
●
●
●
●
−1
0
1
Theoretical Quantiles
54 / 57
Test sur un petit échantillon
Utilisation du logiciel R
Test de normalité
Commande sur R pour le test de Shapiro :
shapiro.test(data)
Résultats obtenus sur R
Shapiro-Wilk normality test
data: data
W = 0.9391, p-value = 0.3715
Interprétation
Comme p − value > 0.05 ⇒ non rejet de H0 au risque 5%
⇒ Normalité de la variable acceptée.
⇒ Test paramétrique de comparaison de moyennes
55 / 57
Test sur un petit échantillon
Utilisation du logiciel R
Test de comparaison de moyennes
Commande sur R (idem cas grand échantillon) :
t.test(data, alternative=’two.sided’, mu=154.5, conf.level=.95)
Résultats obtenus sur R
One Sample t-test
data: data
t = -1.2382, df = 14, p-value = 0.236
alternative hypothesis: true mean is not equal to
154.5
95 percent confidence interval:
144.9372 157.0628
sample estimates:
mean of x
151
56 / 57
Test sur un petit échantillon
Utilisation du logiciel R
Interprétation
Comme p − value > 0.05
⇒ non rejet de H0 au risque 5%
⇒ différence non significative entre la moyenne de la PAS des
hypertendus avec le médicament A et la moyenne théorique de
la PAS des hypertendus au risque α = 5%
⇒ pas d’effet significatif du médicament A sur la PAS des
hypertendus au risque α = 5%
Remarque
Lorsque la taille de l’échantillon (n) diminue, la puissance du
test diminue (= la probabilité de mettre en évidence une
différence significative quand cette différence existe diminue =
le risque de dire qu’il n’y a pas de différence significative alors
qu’il y en a un augmente)
57 / 57
Téléchargement