Bases en biostatistique
Loïc Desquilbet
Département des Sciences Biologiques et Pharmaceutiques
Ecole nationale vétérinaire dAlfort
Version 2.6
11/07/2016
Bases en biostatistique – Loïc Desquilbet © – version v2.6 2/73
T
ABLE DES MATIERES
I.
Introduction ....................................................................................................................... 8
A.
Prologue .......................................................................................................................... 8
B.
Quel intérêt d’enseigner les stat’ dans un cursus vétérinaire ? ..................................... 8
1.
Contexte d’enseignement ........................................................................................ 8
2.
Compétences générales visées ................................................................................ 9
3.
Biostatistique & épidémiologie : unies pour la vie (des animaux) .......................... 9
II.
Définitions et présentation des concepts ....................................................................... 10
A.
La notion d’ « étude » ................................................................................................... 10
B.
Échantillon ..................................................................................................................... 10
C.
Population cible ............................................................................................................. 10
D.
Population source.......................................................................................................... 11
E.
La fluctuation d’échantillonnage ................................................................................... 11
F.
L’inférence statistique ................................................................................................... 12
III.
Statistique descriptive ..................................................................................................... 13
A.
Objectif .......................................................................................................................... 13
B.
Notations ....................................................................................................................... 13
C.
Indicateurs usuels de statistique descriptive ................................................................ 13
1.
Le taux de prévalence ............................................................................................ 13
2.
La moyenne ............................................................................................................ 13
3.
La variance et l’écart-type dans l’échantillon ........................................................ 13
4.
La médiane ............................................................................................................. 14
5.
Les quartiles ........................................................................................................... 14
D.
Qualité d’une estimation ............................................................................................... 14
1.
Problématique ....................................................................................................... 14
2.
Précision ................................................................................................................. 15
3.
Exactitude............................................................................................................... 16
4.
En résumé .............................................................................................................. 17
E.
Interprétation d’une estimation ................................................................................... 17
Bases en biostatistique – Loïc Desquilbet © – version v2.6 3/73
F.
Intervalle de confiance d’une estimation ..................................................................... 18
1.
Théorie et interprétation ....................................................................................... 18
2.
Intervalle de confiance d’un pourcentage ............................................................. 19
3.
Intervalle de confiance d’une moyenne ................................................................ 19
4.
Application sur deux exemples concrets ............................................................... 20
IV.
Jouons un peu avant de passer aux choses sérieuses… .................................................. 21
A.
Le jeu du sac de billes .................................................................................................... 21
1.
Petit rappel de probabilité ..................................................................................... 21
2.
Le jeu proprement dit ............................................................................................ 21
B.
Le jeu du lancer de volant de Badminton ..................................................................... 23
1.
Remarques préalables ........................................................................................... 23
2.
Jean lance aussi fort que possible un volant de Badminton ................................. 23
3.
Jacques pense lancer le volant plus fort que Jean ................................................. 25
V.
La théorie des tests statistique ....................................................................................... 29
A.
Définition du « test statistique » ................................................................................... 29
B.
Quand faire et quand ne pas faire de tests statistiques ? ............................................ 29
C.
La « double » fluctuation d’échantillonnage ................................................................. 29
D.
Problématique ............................................................................................................... 31
E.
Retour sur les lancers de Jean et de Jacques, et analogie ............................................ 32
F.
Les tests statistiques sont des tests d’hypothèse assortis de risques d’erreur ............ 32
1.
Les hypothèses nulle et alternative ....................................................................... 32
2.
Accepter ou rejeter l’hypothèse nulle ? ................................................................ 33
3.
Le risque d’erreur de 1
ère
espèce (erreur de type I) .............................................. 36
4.
Le risque d’erreur de 2
ème
espèce (erreur de type II) ............................................ 37
G.
Le degré de signification................................................................................................ 40
1.
Remarques introductives ....................................................................................... 40
2.
Définition du degré de signification ....................................................................... 41
3.
Commentaires sur la définition du degré de signification ..................................... 41
4.
Lien entre le degré de signification et le risque d’erreur de 1
ère
espèce ............... 43
5.
Sur-interprétations malheureusement classiques du degré de signification ........ 44
Bases en biostatistique – Loïc Desquilbet © – version v2.6 4/73
VI.
La notion d’indépendance des individus ......................................................................... 45
A.
Introduction ................................................................................................................... 45
B.
Définition d’ « indépendance » ..................................................................................... 45
C.
Situations classiques de non indépendance ................................................................. 45
D.
Que faire en cas de non indépendance ? ...................................................................... 46
VII.
Le test de Student pour séries non appariées (comparaison de deux moyennes) ........ 47
A.
Contexte du test de Student pour séries non appariées .............................................. 47
B.
Notations ....................................................................................................................... 47
C.
Conditions de validité du test de Student pour séries non appariées .......................... 48
D.
Rejeter ou accepter H
0
avec le test de Student pour séries non appariées ................. 48
1.
Démarche de calcul ................................................................................................ 48
2.
Interprétation du test lors du rejet de H
0
.............................................................. 50
3.
Interprétation du test lors de l’acceptation de H
0
................................................. 50
4.
Commentaires sur les interprétations du test ....................................................... 51
E.
Calcul du degré de signification p ................................................................................. 52
F.
De quoi dépend le degré de signification ? ................................................................... 53
1.
Cas particulier du test de Student pour séries non appariées............................... 53
2.
Généralisation à tous les tests statistiques ........................................................... 53
3.
Conséquences ........................................................................................................ 53
VIII.
Le test du Chi
2
(comparaison de deux pourcentages) .................................................... 54
A.
Contexte du test du Chi
2
............................................................................................... 54
B.
Notations ....................................................................................................................... 54
C.
Interprétations correctes et incorrectes de pourcentages à comparer ....................... 54
1.
Problématique ....................................................................................................... 54
2.
Comment bien citer deux pourcentages à comparer ? ......................................... 55
3.
(Mauvais) exemple issu de la littérature ............................................................... 56
D.
Conditions de validité du test du Chi
2
........................................................................... 58
E.
Rejeter ou accepter H
0
avec le test du Chi
2
.................................................................. 58
1.
Démarche de calcul ................................................................................................ 58
2.
Interprétation du test lors du rejet de H
0
.............................................................. 60
3.
Interprétation du test lors de l’acceptation de H
0
................................................. 61
4.
Commentaires sur les interprétations du test ....................................................... 61
F.
Calcul du degré de signification .................................................................................... 61
Bases en biostatistique – Loïc Desquilbet © – version v2.6 5/73
IX.
La puissance statistique d’une étude .............................................................................. 62
A.
Remarque préliminaire ................................................................................................. 62
B.
Définition & commentaires ........................................................................................... 62
C.
De quoi dépend la puissance statistique d’une étude ? ............................................... 63
D.
En résumé & commentaires .......................................................................................... 64
E.
Manque de puissance statistique ? ............................................................................... 65
X.
Autres tests statistiques sur des données indépendantes ............................................. 66
A.
Présentation générale ................................................................................................... 66
B.
Le test du Chi
2
testant l’association entre une variable binaire et une variable
qualitative ............................................................................................................................. 67
C.
Le test exact de Fisher ................................................................................................... 68
D.
L’analyse de variance (Anova, pour Analysis of variance) ............................................ 68
E.
Le test de Mann-Whitney (comparaison de deux médianes) ....................................... 69
F.
Le test de Kruskal-Wallis ............................................................................................... 70
XI.
Les tests statistiques sur séries appariées ...................................................................... 71
A.
Introduction ................................................................................................................... 71
B.
Le test de Student pour séries appariées (comparaison de deux moyennes) .............. 71
C.
Le test de Wilcoxon pour séries appariées (comparaison de médianes) ..................... 72
D.
Le test de McNemar pour séries appariées (comparaison de deux pourcentages) ..... 72
XII.
Remerciements ............................................................................................................... 73
1 / 73 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !