A et B

publicité
Biostatistique et Introduction
à la Santé Publique
Probabilités
conditionnelles
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
1
Probabilité conditionnelle
• Notion très courante en médecine, en particulier pour
exprimer la probabilité de maladie en fonction de la
présence ou de l’absence d’un signe.
• Notation Pr(A|B) : probabilité de l’événement B
conditionnellement à la réalisation de l’événement A.
• Autre notation : Pr(A si B)
• Formule Pr(A B)  Pr(A et B)
Pr(B)
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
2
Probabilité conditionnelle
Formule :
Pr(A et B)
Pr(A B) 
Pr(B)
E
E
B
A
A et B
B
A
A|B
Réversibilité : Pr(A et B) = Pr(A|B).Pr(B) = Pr(B|A).Pr(A)
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
3
Probabilité conditionnelle. Exemple.
• 99% des sujets atteint d’une maladie M sont positifs à un
test de dépistage ;
• La maladie M touche 10% de la population
• Quelle est la fraction de la population correspondant aux
sujets malades positifs au test de dépistage ?
• Pr(M)=0,1 Pr(T|M)=0,99
• Donc Pr(T et M) = Pr(T|M).P(M)
= 0,99 x 0,1
= 0,099 = 9,9%
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
4
Indépendance de deux événements
• Deux événements sont indépendants si la connaissance de
l’un ne modifie pas la probabilité de l’autre.
• Si A et B sont indépendants, alors :
Pr(A B)  Pr(A)
Pr(B A)  Pr(B)
• Ou encore : Deux événements A et B (de probabilité non
nulle) sont indépendants si
Pr(A et B) = Pr(A) . Pr(B)
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
5
Théorème de Bayes
• Partant de la formule des probabilités conditionnelles,
Pr(A et B)
Pr(A B) 
Pr(B)
• On modifie l’expression du numérateur :
Pr(A et B) = Pr(B|A).Pr(A)
• Pour aboutir à la première expression du théorème de
Bayes :
Pr(B A) . Pr(A)
Pr(A B) 
Pr(B)
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
6
Théorème de Bayes
• Généralement on ne connaît pas Pr(B), mais on peut écrire
que :
Pr(B)  Pr(A et B)  Pr(A et B)
• De même, on peut écrire :
Pr(A et B)  Pr(B A) . Pr(A)
• D’où la 2e expression du théorème de Bayes :
Pr(A B)
Octobre 2005
Pr(B A).Pr(A)
Pr(B A).Pr(A)  Pr(B A).Pr(A)
Pr P. Ingrand - Biostatistique PCEM2
7
Application des probabilités conditionnelles
à l’évaluation d’un examen diagnostique
• On cherche à chiffrer les performances de l’examen par
son aptitude à donner le plus souvent possible :
– un résultat positif chez les malades
– un résultat négatif chez les non-malades
• Dans une population de taille N, ou dans un échantillon
représentatif, on classe les résultats de l’examen en
fonction de la présence de la maladie.
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
8
Evaluation d’un examen diagnostique
SIGNE S
présent S+
absent S
total
Octobre 2005
MALADIE M
absente
présente
M+
M
total
a
b
vrais positifs
faux positifs
a+b
positifs
c
d
faux négatifs
vrais négatifs
a+c
malades
b+d
non malades
Pr P. Ingrand - Biostatistique PCEM2
c+d
négatifs
N = a+b+c+d
9
Sensibilité et spécificité d’un examen diagnostique
• La sensibilité est la probabilité que le signe soit présent si
le patient est malade.
• Se = Pr(S+ | M+) = a
ac
• Un test est d’autant plus sensible que les sujets malades ont
plus souvent le signe (peu de faux négatifs).
• La spécificité est la probabilité que le signe soit absent si le
patient n’est pas malade.
• Sp = Pr(S | M) = d
bd
• Un test est d’autant plus spécifique que les sujets non
malades ont plus rarement le signe (peu de faux négatifs).
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
10
Valeurs prédictives d’un examen diagnostique
• La valeur prédictive positive est la probabilité que le
patient soit malade si le signe est présent.
a
• VPP = Pr(M+ | S+) =
ab
• La valeur prédictive négative est la probabilité que le
patient ne soit pas malade si le signe est absent.
d
• VPN = Pr(M | S) = c
d
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
11
Valeurs prédictives d’un examen diagnostique
application du théorème de Bayes
• On peut déterminer les valeurs prédictives en fonction de
la sensibilité, de la spécificité et de la prévalence p de la
maladie.
Pr(S M) . Pr(M)
• VPP = Pr(M+|S+) =
Pr(S M) . Pr(M)  Pr(S M) . Pr(M)
Se . p
• VPP = Se . p  (1Sp) . (1p)
Pr(S M) . Pr(M)
• VPN = Pr(M|S) =
Pr(S M) . Pr(M)  Pr(S M) . Pr(M)
Sp . (1p)
• VPN = Sp . (1p)  (1Se) . p
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
12
Valeurs prédictives : exercice 1
Madame Q., âgée de 60 ans, souffre d'insuffisance cardiaque et suit pour cette raison un
traitement digitalique depuis plusieurs mois. Le traitement digitalique est parfois à
l'origine d'une complication grave l'intoxication digitalique dont le diagnostic exact peut
être difficile à affirmer.
Madame Q. se plaint de fatigue générale et est admise à l'hôpital. Un
électrocardiogramme est pratiqué et montre des extrasystoles ventriculaires qui font
évoquer la possibilité d'une intoxication digitalique.
Le dosage de la digoxinémie : concentration des digitaliques dans le sérum, est un test
d'aide au diagnostic de l'intoxication digitalique. Le test est positif si la digoxinémie est
supérieure à 1,7 ng/ml.
Selon des études effectuées chez des patients d'un type comparable à Mme Q.
- le test est positif chez 58 % des patients souffrant d'une intoxication digitalique
authentifiée (sensibilité du test)
- le test est négatif chez 85% des patients indemnes d'intoxication digitalique (spécificité)
On sait par ailleurs que seulement 60 % des patients sous traitement digitalique, chez
lesquels le tableau clinique et électrocardiographique évoquent une intoxication
digitalique en souffrent réellement (probabilité de la maladie a priori).
Déterminer les probabilités de maladie a posteriori. Discuter l’intérêt de l’examen.
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
13
Valeurs prédictives : exercice 1
On note M l’intoxication digitalique, S la positivité du test.
On retrouve dans les données la prévalence de l’intoxication digitalique,
probabilité a priori : Pr(M) = 0,6
La sensibilité du test : Se=P(S+|M+)=0,58 et la spécificité : Sp=P(S-|M-)=0,85
probabilité a posteriori de l’intoxication digitalique si le test est positif
0,580,6
P(M+ | S+) = 0,580,6  0,150,4 = 0,85
probabilité a posteriori de l’intoxication digitalique si le test est négatif
0,850,4
P(M+ | S-) = 1 P(M-|S-) = 1  0,850,4  0,420,6= 0,43
Valeur informationnelle : les probabilités a posteriori sont nettement différentes
de la probabilité a priori .
Valeur décisionnelle : faible. La valeur prédictive négative proche de 0,5 de
même que la faible sensibilité doivent faire douter fortement de la signification
d’un résultat négatif.
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
14
Valeurs prédictives : exercice 2
Le test immunologique ELISA de l'infection par le virus de l'immunodéficience humaine (VIH, virus du SIDA) possède une spécificité égale à
0,995 et une sensibilité égale à 0,983. Un test diagnostique positif définit la
séropositivité. La mise en œuvre d'un dépistage systématique à l'aide de ce test
a été envisagée par les autorités sanitaires afin d'enrayer la propagation de
l'épidémie d'infection à VIH.
1) La prévalence de l'infection par le VIH en France est égale à 0,005. Calculer
la valeur prédictive positive et la valeur prédictive négative du test ELISA
lorsque le dépistage est appliqué à la population française.
2) Dans certains groupes à risque, la prévalence de l'infection par le VIH est
égale à 10 %. Calculer la valeur prédictive positive et la valeur prédictive
négative du test ELISA lorsque le dépistage est appliqué à la population à
risque.
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
15
Valeurs prédictives : exercice 2
1) Dans la population générale où la prévalence de l’infection à VIH est
faible : VPP=0,497 VPN=0,9991
2) Dans une population à risque où la prévalence est élevée :
VPP=0,9562 VPN=0,9981
Examinées globalement, les valeurs prédictives sont plus satisfaisantes dans
une population à risque.
En population générale, un test positif sur deux est un faux positif, ce qui
entraîne des problèmes : comment annoncer le résultat, quelle stratégie
d’examens de confirmation ?
Cet exemple permet d’opposer dépistage en population à dépistage ciblé pour
une détection efficace des cas.
L’attitude est différente quand il s’agit de dépister les dons à risque chez les
donneurs de sang : on peut écarter du circuit transfusionnel tous les dons
positifs sans que cela pose de problème même avec une VPP faible tandis que
la valeur élevée de la VPP est dans ce cas une garantie de sécurité pour les
transfusés.
Octobre 2005
Pr P. Ingrand - Biostatistique PCEM2
16
Téléchargement