TABLE DES MATIÈRES i
Introduction au cours
L’objectif de ce cours est de comprendre le fonctionnement / justifier la perti-
nence de tests statistiques couramment utilisés dans la vie de tous les jours et en
particulier en biologie et en médecine. Afin d’illustrer notre propos, considérons les
deux exemples suivants.
Les données représentées dans le tableau ci-dessous proviennent du “National Vital
Statistics Report” et concernent les naissances aux USA en 1997. Elles donnent le
nombre de naissances suivant le type de jour dans la semaine (jours ouvrables ou
week-end) et suivant le mode d’accouchement (naturel ou par césarienne).
Naissances Naturelles César. Total
J.O. 2331536 663540 2995076
W.E. 715085 135493 850578
Total 3046621 799033 3845654
Naissances Naturelles César. Total
J.O. 60.6% 17.3% 77.9%
W.E. 18.6% 3.5% 22.1%
Total 79.2% 20.8% 100.0%
On souhaite savoir si le type du jour de naissance (jour ouvrable ou week-end) et le
mode d’accouchement (naturel ou césarienne) sont indépendants ou non. La réponse
du statisticien est sans appel : avec une certitude de 99.999%, on peut affirmer que
les deux caractères ne sont pas indépendants (il y a en fait plus de chances de donner
naissance par césarienne les jours ouvrables que les week-end).
Comment peut-on arriver à une telle conclusion ? En particulier, à quoi correspond
le chiffre 99.999% ? Nous répondrons à ces questions au chapitre 6sur les tests
statistiques.
F
Autre exemple, nous sommes au second tour d’une élection présidentielle, i.e. il reste
deux candidats en lice, Aet B. Le vote a lieu le dimanche, les bureaux de votes
ferment à 18h,20hdans les grandes villes. Pourtant, les résultats sont annoncés dès
20hsur les chaînes de télévision : Aa obtenu 50.9% des voix contre 49.1% pour B,
la fourchette d’erreur est de 0.7%, donc Aest gagnant.
Comment peut-on arriver à une telle conclusion alors que tous les bulletins n’ont pas
été dépouillés ? Combien de bulletins doit-on effectivement dépouiller pour pouvoir
affirmer que la marge d’erreur est de 0.7% ? Si le résultat était de 50.1% contre 49.9%,
à quel moment de la soirée pourrait-on avoir une estimation fiable du vainqueur ?
Là encore, des réponses à ces questions peuvent être données grâce à la théorie des
probabilités aux tests statisques. Il est important de comprendre le fonctionnement
de ces tests lorsqu’on les utilise. D’une part, cela évite d’appliquer des tests à des
situations qui ne s’y prêtent pas, d’autre part cela permet d’avoir un regard critique
sur des conclusions parfois hatives / erronées basées sur des données expérimentales.