Fiche : Logique-Ensembles

publicité
Fiche : Logique-Ensembles
Défnitons
On appelle épreuve le protocole d’une expérience dont le résultat est aléatoire. Chaque résultat de l’épreuve
défnit un événement élémentaire. L’ensemble de tous les événements élémentaires forme l’univers ou
événement certain de l’épreuve. On appelle événement un sous-ensemble de l’univers, pouvant être composé
de plusieurs ou d’un seul événement élémentaire ou être vide. On notera ∅ l’ensemble vide, c’est à dire
l’événement ne contenant aucun événement élémentaire.
On appelle ensemble dénombrable un ensemble possédant un nombre enter d’éléments (ex : l’ensemble des
enters naturels ou une parte de celui-ci, nombre de globules rouges, de bizuths, etc…) et indénombrable un
ensemble possédant un nombre infni d’éléments (ex : l’ensemble des nombres réels ou une parte de celui-ci,
glycémie, taille, etc…).
Calculs sur les événements
Dans tout ce paragraphe, on considèrera un univers Ω et deux événements A et B de cet univers.
Union de deux événements
On note A
B l’événement qui est réalisé si A, si B, ou si les deux simultanément sont réalisés.
A
A
BB B
BB B
Ω
Intersecton de deux événements
On note A
B l’événement qui est réalisé si A et si B sont réalisés simultanément.
Ω
A
B
Si A ∩ B = ∅, on dit que A et B sont disjoints ou incompatbles.
Contraire de A
On note A l’événement qui est réalisé quand A ne l’est pas.
Ω
A
Partton d’un univers
On dit que les j événements Ej réalisent une partton de l’univers si est seulement si :
•
•
E1 = Ω
E2
∀(i, j ) Ei
... E j
Ej = 0
Ex : E1, E2 et E3 réalisent une partton de Ω.
E1
E3
E2
Fiche : Probabilités : défnitons et résultats primordiaux
Défniton : loi de probabilité sur un univers Ω
On appelle loi de probabilité sur Ω l’applicaton qui à tout événement de Ω, associe un réel de l’intervalle[0,1] .
P(= ) 0
P (Ω ) = 1
Deux valeurs à retenir : (2-1)
Résultats
(2-2)
(2-3)
P
r(
A)=
B
P
r+
( )−
A
P
r( ) B
P
r(
A) B
Pr( )A 1=
P
−
r( )A
Formule des probabilités totales
Si les j événements Ek ,1
k j
réalisent une partton de Ω, alors : (2-4)
j
Pr( A) = Pr( A E )
k =1
k
Ce qui se démontre par l’analogie aires-événements.
Défniton : variable aléatoire
On appelle variable aléatoire sur Ω l’applicaton qui à tout événement de Ω associe un réel. On peut aussi la
défnir comme toute épreuve dont les événements élémentaires sont des nombres. Il faut noter que si à un
événement correspond un nombre précis, à un nombre peut correspondre plusieurs événements.
Notatons
On notera par une majuscule une variable aléatoire, par exemple X, Y, Z… et par une minuscule les valeurs que
cete v.a. prend, par exemple, x, y, z…
Loi de probabilité d’une variable aléatoire
On appelle loi de probabilité d’une variable aléatoire l’applicaton qui à toute valeur que prend une v.a. donnée
un réel de l’intervalle [0,1] . On appelle ce réel probabilité de l’événement « la variable aléatoire X prend la
valeur x » que l’on note Pr(X=x)
Foncton de répartton d’une variable aléatoire
On appelle foncton de répartton d’une variable aléatoire la foncton F défnie par
•
Caractéristques de la foncton de répartton
lim F ( x ) = 0
x−
lim F ( x ) = 1
x+
F ( x) croissante sur
Fx
() P
=
rX
( <
x)
Fiche : Probabilités conditonnelles et indépendance. Notons sur la qualité des
essais thérapeutques.
Défniton
On note Pr( B / A) la probabilité de réalisaton de l’événement B sachant que l’évènement A est déjà réalisé.
Pr( B/ A) =
Pr( A B)
Pr( A)
(3-1)
Pour comprendre la diférence entre conditonnement et intersecton, l’aide d’un schéma peut être utle.
Notons A la moité supérieure, en gris, du rectangle ci-dessus et B, le quart supérieur droit, hachuré noir et gris.
(B est donc inclus dans A). Si l’on suppose qu’un enfant saute dans le rectangle, il a une chance sur deux de
tomber dans A. D’où Pr(A)=0,5.
Une fois en A, l’enfant saute de façon à ne pouvoir aterrir que dans la moité supérieure du rectangle, donc en
A. Il a ainsi une chance sur deux de tomber en B, sachant qu’il a déjà sauté en A. D’où Pr(B/A)=0,5
En revanche, la probabilité de tomber directement en B (donc en A et en B à la fois) dès le premier saut est
égale au rapport de la superfcie de B à celle du rectangle, donc à 0,25. D’où Pr(A∩B)=0,25.
Deux événements A et B sont dits indépendants 1 si et seulement si la réalisaton de l’un n’infue pas sur la
réalisaton de l’autre. Donc en langage mathématque Pr( A / B) = Pr( A) et Pr( B / A) = Pr( B) . Donc
d’après (3-1), si deux événements A et B sont indépendants, on a
P
r(
A)=
B
P
r( )P
A
r( )B
(3-2).
Propriété : contnuité des lois de calcul sur les probabilités.
Les formules (2-2), (2-3), (2-4) et (3-2) restent valables même s’il s’agit de probabilités conditonnelles.
(2-2 bis) Pr(( A = B) / M )
1
+Pr( A / M ) −Pr( B / M ) P(( A
B) / M )
Atenton ! « Evènements indépendants » ne veut pas dire « évènements disjoints » ! Exemple tout bête : la
réalisaton des événements « Je réussis ma P1 » et « Le perroquet du pirate est rouge » n’ont aucune infuence
l’un envers l’autre. Cependant l’événement « Je réussis ma P1 et le perroquet du pirate est rouge » existe, donc
ces événements sont bien indépendants et non disjoints.
(2-3 bis) Pr( A / M ) = 1 − Pr( A / M )
(2-4 bis) Si les j événements Ek ,1
k j
j
réalisent une partton de M, alors Pr( A / M ) =
Pr(( A
k =1
E k) / M )
(3-2 bis) Si deux événements A et B sont indépendants conditonnellement à un événement M, alors
Pr(( A = B) / M ) Pr( A / M ) Pr( B / M )
Théorème de Bayes
Ce théorème sert à calculer Pr(B/A) si l’on dispose de
Pr( B / A) =
Pr( B), Pr( A / B) et Pr( A / B )
Pr( A B )
Pr( A / B) P ( B )
=
d ' après (3 − 1) et (2 − 4)
Pr( A)
Pr( A + B ) Pr( A B )
D’où le théorème de Bayes :
Pr( B/ A
)
=
Pr( A/ B)Pr( B)
Pr( A/ B)Pr( B) Pr(+A/ B)Pr( B)
(3-3)
Applicaton biomédicale : appréciaton de la qualité des essais thérapeutques2
Nous désignerons par S « être positf au test » ou « présenter le signe » (expressions équivalentes) et par M
« être malade »
Prévalence d’une maladie : proporton de la populaton soufrant de la maladie.
Prev
=
M
Pr( )
Seuil : valeur du paramètre biologique étudié en-dessous duquel on déclare l’individu sain et au-dessus
duquel on déclare l’individu malade.
Notons de sensibilité et de spécifcité
•
Si l’on note
Sensibilité : Probabilité d’être positf au test sachant que l’on est malade.
Se =
S
Pr(M/ )
(3-4)
FM la foncton de répartton chez les individus malades de la valeur biologique T étudiée et s le
seuil choisi, alors
Se =>
T
Pr(s =
M
−
/ ) F
1 s ()
M
(3-5). Si l’on cherche à mener une campagne de dépistage,
on privilégiera les tests à la sensibilité élevée.
•
Si l’on note
choisi, alors
Spécifcité : Probabilité d’être négatf au test sachant que l’on est sain.
Sp =P
Tr( M
/ )
(3-5)3.
FNM la foncton de répartton chez les individus sains de la valeur biologique S étudiée et s le seuil
Sp =<
T
Pr(s N
=
M
/
F
) s ()
NM
(3-6). Un examen de spécifcité élevée sera utlisé pour une
confrmaton de diagnostc.
Notons de valeurs prédictves positve et négatve (VPP/VPN)
2
3
Ces points sont fondamentaux et doivent être connus par cœur : tous les ans, des questons tombent dessus !
Notez que l’événement S / M n’est pas le contraire de S / M ! En efet, on ne pose pas la même conditon
sur ces deux événements. S / M est donc le contraire de S
/ M , et S / M , celui de S / M
•
VPP : probabilité d’être malade sachant que l’on est positf au test. VPP = Pr(M / S ) . Par le
théorème de Bayes,
•
VPP =
SePrev
SePrev + (1−
Sp )(1
−Prev )
(3-7).
VPN : probabilité de ne pas être malade sachant que l’on est négatf au test.
Par le théorème de Bayes,
VPN =
Sp (1 −
Prev )
Sp (1 −
Prev )+ (1
− Se )Prev
VPN = Pr(M / S ) .
(3-8).
Courbes ROC
L’intérêt des courbes ROC est de présenter dans un même graphique la sensibilité et la spécifcité d’un ou
plusieurs tests pour diférents seuils.
La courbe ROC porte en abscisse 1-Sp et en ordonnée Se. Pour une courbe ROC relatve à un test diagnostque
donnée, plus un point est proche du coin supérieur gauche, meilleur est le seuil qui correspond à ce point.
Figure 1 Courbe ROC de trois tests. D'après Polycopié de Biostatstque PCEM1 2008-2009, Golmard, Mallet, Morice
Ici, pour le test A au seuil 39°C, la sensibilité est de 0,65 et la spécifcité de 0,75. Le test C est toutefois meilleur
que le test A.
Quant au test B il n’apporte aucun intérêt diagnostc, en efet pour tout seuil s,
Se=1-Sp  P(S/M)=1-P(NS/NM)P(S/M)=P(S/NM) : un sujet, sain ou malade, aura la même probabilité d’être
positf au test B.
Evaluaton de la sensibilité et de la spécifcité à partr d’efectfs observés
•
Vrais positfs (VP) : personnes malades présentant le signe
•
Faux positfs (FP) : personnes saines présentant le signe
•
Vrais négatfs (VN) : personnes saines ne présentant pas le signe
•
Faux négatfs (FN) : personnes malades ne présentant pas le signe
VP
VP + FN
(3-9).
VN
Sp
VN + FP
Se
On a alors
A retenir : Diférence conditonnement/indépendance, sensibilité, spécifcité, VPP, VPN
Téléchargement