Biostatistiques Sciences FUNDP
Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
17/10/08 Module 30 - 1
www.fundp.ac.be/biostats Module 30
30 PROBABILITES......................................................................................................................................2
30.1 INTRODUCTION ...................................................................................................................................2
30.2 NOTIONS D'EPREUVE ET D'EVENEMENT .............................................................................................3
30.3 NOTION DE PROBABILITE....................................................................................................................5
30.3.1 La probabilité définie à partir de l'observation.......................................................................6
30.3.2 Propriétés des probabilités .......................................................................................................7
30.3.3 La probabilité définie a priori...................................................................................................7
30.4 LOIS DE PROBABILITES .......................................................................................................................8
30.4.1 Tables de contingence ...............................................................................................................8
30.4.2 Probabilités conditionnelles......................................................................................................8
30.4.3 Indépendance .............................................................................................................................9
30.4.4 Loi des probabilités composées ..............................................................................................11
30.4.5 Condition d’indépendance ......................................................................................................11
30.4.6 Loi des probabilités totales .....................................................................................................13
30.4.7 Reconstruction de P(A)............................................................................................................14
30.5 EXEMPLES .........................................................................................................................................15
30.5.1 Probabilité a priori et a posteriori .........................................................................................15
30.5.2 Petites et grandes populations ................................................................................................15
30.6 FAUX NEGATIF ET FAUX POSITIF. .....................................................................................................17
Biostatistiques Sciences FUNDP
Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
17/10/08 Module 30 - 2
30 Probabilités
30.1 Introduction
Dans le premier chapitre, nous avons parcouru une partie importante des
statistiques descriptives, et nous pouvons manipuler l'essentiel des techniques
les plus communément employées.
Cependant, l'intérêt du chercheur ne se limite généralement pas à crire un
échantillon de valeurs expérimentales. Intéressé par le phénomène naturel qu'il
cherche à décrire, son but est de pouvoir étendre ses conclusions à l'ensemble
de la population qu'il étudie.
Imaginons qu'avant de se lancer dans la conception d'un analgésique,
une firme pharmaceutique souhaite terminer la proportion
π
d'une
population qui souffre de migraines.
normaux
70%
migraineux
30%
Figure 30 -1 Proportion de migraineux dans une population fictive.
Il est peu réaliste de vouloir interroger tous les individus de la population. Il
faudra généralement se limiter à observer un échantillon, en étant attentif à ce
qu'il représente bien la population au sujet de laquelle on souhaite tirer des
conclusions.
Les observations qui seront réalisées dans l'échantillon devront donc être
extrapolées à l'ensemble de la population. Cette démarche est celle de
l'inférence statistique, très fréquente dans l'expérimentation scientifique.
Biostatistiques Sciences FUNDP
Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
17/10/08 Module 30 - 3
Nous avons déjà défini la population et l'échantillon. Tout le monde admettra
que la proportion de migraineux observée dans l'échantillon ne sera pas
exactement égale à la proportion dans l’ensemble de la population. Si je prends
plusieurs fois un échantillon dans la population, les valeurs de p seront toutes
différentes. Je peux seulement espérer que les caractéristiques de mon
échantillon soient telles que ces deux valeurs soient relativement proches :
π = p1 ± une « petite erreur ».
Cependant le fait d'observer une variabilité dans ces valeurs ne veut pas dire
que l'on puisse obtenir « n'importe quoi ». Le hasard suit certaines règles et,
dans certaines circonstances, il nous sera possible de répondre aux questions
suivantes :
imprécision
quelle est cette petite erreur ?
incertitude
quel est le risque de se tromper en affirmant que
π = p ± cette « petite erreur »?
Pour aborder ces questions, il est nécessaire d'introduire quelques éléments de
la théorie des probabilités. Ceci nous permettra de suivre une démarche
déductive.
Notez qu’il est préférable de parler de l’imprécision (qui est inévitable) que
d’erreur (qui est supposée évitable).
La déduction est la marche qui consiste à prédire, à partir d'une population
connue, quelles seront les caractéristiques des échantillons qui y seront
prélevés. Ensuite, cette connaissance sera utilisée pour suivre une démarche
dite inductive (ou inférentielle). L'induction est la démarche suivant laquelle on
peut prédire les caractéristiques d'une population inconnue à partir des
statistiques calculées dans un échantillon.
30.2 Notions d'épreuve et d'événement
L’ épreuve est une expérience dont le résultat n'est pas prévisible, et pour
laquelle on peut définir l'ensemble des résultats possibles.
Si je prends un individu au hasard dans la population, je ne peux pas
déterminer a priori2 quel est son groupe sanguin: le résultat n'est pas
1 Dans notre notation, P représente le mot Probabilité, p sa valeur
observée (en fait, une fréquence relative) et
π
sa valeur théorique.
Biostatistiques Sciences FUNDP
Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
17/10/08 Module 30 - 4
prévisible. Par contre, je peux déterminer l'ensemble des possibilités : A,
B, AB, O. Cette expérience est une épreuve.
Si mon expérience consiste à questionner les gens dans la rue : "A quoi
avez -vous pensé en premier lieu ce matin à votre réveil?", le résultat
n'est pas prévisible mais je ne peux pas non plus définir l'ensemble des
résultats possibles… Cette expérience n'est pas une épreuve.
Ajoutons à la définition de l'épreuve que cette expérience peut être reproduite
dans les mêmes conditions autant de fois que l'on veut.
Ceci n'est pas le cas si l'expérience consiste à déterminer le taux de C14
dans une relique unique pour en déterminer l'âge.
- L'événement est un sous -ensemble des résultats possibles de l'épreuve.
Je peux finir l'événement A comme "l'individu est migraineux". Lors
d'une réalisation de l'épreuve (prendre un individu au hasard et
déterminer s'il est migraineux) on dira que l'événement A est, ou n'est
pas, réalisé, si l'individu est, ou n'est pas, sujet à la migraine.
Je peux aussi définir l'événement B comme "l'individu est du groupe
sanguin A ou B". Cet événement sera réali3 si l'individu est soit du
groupe sanguin A, soit du groupe sanguin B.
- Des événements incompatibles sont des événements tels que la réalisation
de l'un entraîne la non réalisation de l'autre. Les événements A "l'individu est
du groupe sanguin A" et B "l'individu est du groupe sanguin O" sont
incompatibles.
- Des compositions d'événements sont des événements définis à partir
d’autres événements.
L'union de deux événements, A B, est un événement qui est réalisé
lorsque A ou B est réalisé.
Dans notre exemple, A
B correspond à l'événement : l'individu est du
groupe A ou du groupe B.
2 a priori : avant de faire la mesure, l'expérience
3 On utilise parfois le mot occurrence pour désigner le fait d’observer la
réalisation d’un événement. Ce mot est emprunté à la linguistique : on
parle de l’occurrence d’un mot déterminé dans un texte. De même on
parle de l’occurrence d’un événement dans un espace -temps déterminé.
Biostatistiques Sciences FUNDP
Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
17/10/08 Module 30 - 5
A * est défini comme le sous -ensemble de tous les résultats de l'épreuve
qui entraînent la non réalisation de A.
Des événements contraires, A et A * sont des événements incompatibles
dont l'union correspond à l'ensemble des résultats possibles.
Classons tous les individus de la population soit dans la catégorie
"migraineux", soit dans la catégorie "non migraineux", sans aucune
ambiguïté. Si A représente les migraineux, A * représente les non
migraineux.
L'intersection de deux événements, A B est un événement qui est réalisé
lorsque A et B sont réalisés simultanément.
Si A représente « les individus du groupe sanguin A ou O » et B « les
individus du groupe sanguin B ou O », alors A
B correspond à
l'événement : l'individu est du groupe sanguin O.
L'intersection de deux événements incompatibles est un ensemble vide.
Si A représente les individus du groupe A et B les individus du groupe
sanguin B alors A
B ne représente plus personne ( il n'est pas possible
d'être A et B à la fois).
L’événement (A B) * est identique à l’événement A * B * et l’événement (A
B) * est identique à l’événement A * B *.
Cette propr est particulièrement utile pour résoudre certains
problèmes en transformant une intersection inconnue en union connue et
réciproquement.
30.3 Notion de probabilité
Reprenons le problème posé au départ : on entreprend une recherche dont le
but est de terminer la proportion de migraineux dans la population. Dans la
terminologie que nous venons de définir , le problème pourrait être posé ainsi :
- soit une épreuve qui consiste à prendre un individu au hasard dans la
population
- soit l'événement A : l'individu est migraineux,
- quelle chance a -t -on de réaliser cet événement lors d'une épreuve ? Ou, en
d'autres termes :
Quelle est la probabilité de réalisation de l'événement A?
1 / 18 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !