Biostatistiques UE4
Paris 11
Résumé de cours : Tests statistiques
1. Généralités
On utilise les tests pour comparer une observation avec une référence théorique ou pour comparer
deux observations entre elles.
Les tests sont basés sur un raisonnement par l’absurde : on suppose qu’une hypothèse (H0,
l’hypothèse nulle) est vraie, et après quelques calculs on trouve soit que le résultat est incompatible
avec H0, auquel cas on rejette H0, soit que le résultat est compatible avec H0 et on ne rejette pas H0.
La décision d’accepter ou de rejeter H0 comporte des risques d’erreur. Le risque de première espèce,
noté , est la probabilité de rejeter H0 sachant que H0 est vraie. Il est généralement fixé à 5%. On
l’appelle également seuil de signification. Le risque , ou risque de deuxième espèce, est le risque de
ne pas rejeter H0 sachant qu’elle est fausse. On l’utilise plus rarement comme seuil, car ce risque n’est
généralement pas calculable. La puissance d’un test est 1 − , c’est la capacité à rejeter une hypothèse
H0 fausse ( ( 0)).
Le degré de signification, noté , est la probabilité sous H0 que le hasard seul produise un écart en
valeur absolue égal ou plus grand à celui observé. Si < , alors on rejette H0. Si > , on ne
rejette pas H0.
Pour choisir le bon test, il faut regarder la nature des variables à comparer (qualitative, quantitative),
les grandeurs étudiées (moyennes, effectifs, proportions, etc.), la nature de la comparaison (référence
vs. observé ou observé vs. observé), l’appariement éventuel des données et les conditions
d’application (taille échantillon, effectifs, normalité, égalité des variances).
On choisira un test bilatéral ou unilatéral en fonction du contexte (mais sans tenir compte de
l’observation).
2. Test sur les proportions (variables qualitatives à 2 modalités)
a. Comparaison d’une proportion observée à une valeur de référence
H0 : , la proportion dans la population dont est issu l’échantillon, est égale à , valeur de référence.
Conditions : ≥30, ≥5 et (1−)≥5
Statistique de test : −
(1−)
~(0,1)
avec la proportion de référence et la proportion observée dans l’échantillon
b. Comparaisons de deux proportions observées
H0 : =, avec (resp. ) la proportion dans la population dont est issu l’échantillon A (resp. B).
Conditions : ≥30, ≥30, ≥5, (1−)≥5, ≥5 et (1−)≥5
On définit l’estimation de la proportion dans les populations A et B sous H0 :
=+
+
Statistique de test : −
(1−)1
+1
~(0,1)
avec et les proportions observées dans les échantillons A et B et et les effectifs des
échantillons.