P(A et B) - L`UNF3S en 2015, c`est

publicité
Probabilités
Pr. François Kohler
[email protected]
Expérience aléatoire,
événement aléatoire
• Une expérience est dite aléatoire (random
experiment-random trial) lorsqu'on ne peut pas en
prévoir exactement les résultats du fait que tous
les facteurs qui déterminent ce résultat ne sont
pas maîtrisés ou contrôlés.
• Un événement aléatoire est un événement qui
peut ou ne pas se réaliser au cours d'une
expérience aléatoire.
• Exemple : expérience aléatoire "traverser la route"
- événement aléatoire "se faire écraser".
Définition classique
• Si m résultats peuvent se produire avec des
chances égales et si k résultats correspondent
à la réalisation de l'événement, la probabilité
de l'événement est le rapport k/m : nombre
de cas favorables sur nombre de cas possibles.
• Par exemple, dans un jeu de 52 cartes, on a 13 coeurs,
si toutes les cartes ont des chances égales d'être tirées,
la probabilité d'extraire un cœur est 13/52 = 0,25
Définition fréquentielle
• Si une expérience a été répétée un grand
nombre de fois dans des conditions
uniformes, on constate généralement que la
fréquence relative (% de réalisation) d'un
événement (fi) se stabilise.
• Ce phénomène est connu sous le nom de
régularité statistique.
• Ce nombre fixe est par définition la
probabilité mathématique de l'événement
considéré.
Définition fréquentielle
• La probabilité ainsi définie est une forme
idéalisée de la fréquence relative.
• Une estimation pragmatique de la probabilité
d’un événement est fournie par la fréquence
relative, la précision de cette estimation peut être
fournie par son intervalle de confiance pour un
risque donné.
• Dans de nombreux cas, la probabilité peut être
modélisée par une loi.
Expérience, événement,
propositions, logique…
• Evénement : toute proposition logique
associée aux résultats de l’expérience.
• Représentation ensembliste :
– Diagramme de Venn
S ensemble des événements possibles
A sous-ensemble de S
B sous-ensemble de S
….
Evénements exclusifs
• Les événements A et B ne peuvent se produire
simultanément. Pour tous couples (A,B)
l'ensemble A* B est vide.
– Exemple : extraire un cœur ou un carreau.
• Si 2 événements sont exhaustifs et
mutuellement exclusifs (mort-vivant)
– La non-réalisation de l’un implique la réalisation
de l’autre.
Evénements non exclusifs
• Les événements peuvent se produire
simultanément .
• L’intersection n’est pas vide.
• Exemple :
• Extraire une dame et un carreau
• Avoir un diabète et rouler avec des pneus lisses.
• Avoir un diabète et une angine.
• Ne pas confondre événements exclusifs et
événements indépendants.
Opérateurs logiques
• On note Vrai 1, Faux 0.
A ou B; A et B;
Non(A) Non(A)
A B A U B; AB; Non(A) Non(B) Non(AouB) Non(AetB) et
ou
A+B
A*B
Non(B) Non(B)
1
1
0
0
1
0
1
0
1
1
1
0
1
0
0
0
0
0
1
1
0
1
0
1
0
0
0
1
0
1
1
1
0
0
0
1
0
1
1
1
Rappel de logique
A et B
A
A ou B
B
Non(A)
Non(B)
Non(A et B)
Non(A ou B)
Rappels de logique
• Théorèmes de De Morgan
– Non(A et B) = Non(A) ou Non(B)
– Non(A ou B) = Non(A) et Non(B)
• La plupart des problèmes de probabilités n’ont
comme difficulté que l’interprétation logique
de l’énoncé.
Axiomes élémentaires
•
•
•
•
0 < P(A) < 1 : Une probabilité est toujours comprise entre 0 et 1.
P(A) = 1 : L’événement est toujours réalisé.
P(A) = 0 : L’événement est impossible.
Si 2 événements sont exclusifs :
– P(A ou B) = P(A + B) = P(A U B) = P(A) + P(B)
• Exemple : Probabilité d'extraire un cœur ou un carreau = P(Cœur ou Carreau) =
0,25 + 0,25 = 0,5.
– Généralisation P(A+B+C) = P(A)+P(B)+P(C).
– Si 2 événements sont mutuellement exclusifs (mort-vivant) et
constituent l’ensemble des possibles :
• on a P(A)+P(B) = 1 => P(A) = 1-P(B).
– La probabilité de survie à un moment donné est égale à 1 moins la probabilité de
décéder à ce moment.
Evénements non exclusifs
• Les événements peuvent se produire simultanément. Exemples :
« avoir un infarctus du myocarde », « être diabétique ».
• P(A ou B)
= P(B ou A)
= P(A) + P(B) - P(A et B)
• Ceci se déduit des relations :
–
–
–
P(A ou B) = P(A sans B) + P(B sans A) + P(A et B)
P(A sans B) = P(A) - P(A et B)
P(B sans A) = P(B) - P(A et B)
• En conclusion :
– P(A ou B) < P(A) + P(B)
– P(A ou B ou C) = P(A) + P(B) + P(C) - P(A et B) - P(B et C) - P(A et C) +
P(A et B et C)
Probabilités conditionnelles
et indépendance
• En médecine, l’utilisation des probabilités
conditionnelles est fréquente et apparaît naturelle.
– On dira que « un individu a 5 fois plus de chances de
développer une maladie coronarienne s’il fume un
paquet de tabac par jour que si il ne fume pas »…
• La connaissance n’est pas figée : avant la
réalisation d’un test, la probabilité d’une maladie
est p. Que devient-elle si on sait que le test est
positif ?
Probabilité conditionnelle
• Soit deux événements non exclusifs A et B :
– On regarde la probabilité que l’un se réalise alors
que l’autre est déjà réalisé.
• On note P(A/B) la probabilité de A si B est
réalisé, l’inversement du conditionnement
P(B/A) est la probabilité de B si A est réalisé.
• Quelle est la probabilité d’avoir une douleur de la fosse
illiaque droite alors que l’on a une appendicite ?
• Quelle est la probabilité d’avoir une appendicite alors
que j’observe une douleur dans la fosse iliaque droite ?
Probabilité conditionnelle
• Eléments de base :
P( A  B)
P( B)
P( A  B)  P( B  A)  P( A / B) * P( B)  P( B / A) * P( A)
P( A / B) 
• Indépendance :
– Deux événements sont indépendants si la réalisation
de l’un n’influence pas la réalisation de l’autre.
• Exemple : Pluie, rouler avec des pneus lisses : a priori
indépendant; pluie, avoir un accident a priori non
indépendant.
Indépendance
• P(A/B) = P(AB)/P(B) = P(A)
=> P(AB) = P(A)*P(B)
• Si et seulement si deux événements sont
indépendants alors P(A et B) = P(A) * P(B)
Inversion du conditionnement
• Intérêt : évaluation des examens complémentaires.
• Théorème de Bayes :
P( A  B)
 P( A  B)  P( A / B) * P( B)
P( B)
P( A  B) P( A / B) * P( B)
P( B / A) 

P( A)
P( A)
P( Non B)  1  P( B)
P( A / B) 
P(A/B)
B
P(B)
P( A / Non B)  1  P( Non A / Non B)
P( A)  P( A / B) * P( B)  P( A / Non B) * P( Non B)
P( A)  P( A / B) * P( B)  [1  P( Non A / Non B)] *[1  P( B)]
A
Non A
A
Non B
P(A)/nonB)
Non A
Le tableau à 4 cases
• En médecine, 2 tableaux
à 4 cases sont très
utilisés et renvoient au
conditionnement.
– Evaluation des signes et
examens
complémentaires.
– Recherche de facteurs de
risque.
Test +
Test Total
Maladie +
Maladie A (VP)
B (FP)
C (FN)
D (VN)
M+ = A+C = VP+FN M-=B+D=FP+VN
Total
T+=A+B=VP+FP
T-=C+D=FN+VN
n
P(T+/M+); P(T-/M-); P(M+/T+); P(M-/T-)
Maladie +
Maladie -
Total
Exposés
A
B
E+=A+B
Non exposés
C
D
E-=C+D
M+ = A+C
M- = B+D
A+B+C+D
P(M+/E+); P(M+/E-); P(E+/M+);P(E-/M-)
Les arbres de décision
• Un homme se présente aux
urgences. Quelle est la
probabilité qu’il ait une
sténose coronarienne ?
( Coro+) = P (EE+  Coro+) + P (EE-  Coro+)
= 0,8*0,6 + 0,4*0,3
= 0,48 + 0,12
= 0,60
Evaluation des examens
complémentaires
• Il n’existe pas de signe ou
d’examen parfait qui serait
toujours présent en cas de
présence de la maladie et
absent en cas d’absence de
la maladie.
Maladie +
Maladie -
Total
Test +
A (VP)
B (FP)
T+=A+B=VP+FP
Test -
C (FN)
D (VN)
T-=C+D=FN+VN
Total
M+ = A+C =
VP+FN
M=B+D=FP+VN
N=A+B+C+D
Fréquence de la maladie = Prévalence=P(M+)
= (VP+FN)/N
Sensibilité = P(T+/M+) = VP/(VP+FN)
Spécificité = P(T-/M-)= VN/(VN+FP)
VPP = P(M+/T+) = VP/(VP+FP)
VPN = P(M-/T-) = VN/(VN+FN)
Evaluation des examens
complémentaires
• La prévalence de la maladie dépend de différents
facteurs notamment :
– Zone géographique : le paludisme est beaucoup plus
fréquent en Afrique qu’en France.
– De la sélection réalisée par le premier niveau de soins
(la prévalence dans le groupe sélectionné est égale à
la VPP du test qui a servi à la sélection).
– ….
• La prévalence est la probabilité d’avoir la maladie
avant d’avoir fait le test : probabilité pré-test.
Evaluation des examens
complémentaires
• Sensibilité (probabilités des tests positifs chez les
malades) et spécificité (probabilités des tests
négatifs chez les non malades) sont des
caractéristiques intrinsèques du test.
• Elles supposent le problème résolu puisqu’ un
test de référence (gold standard) a permis de
déterminer si la personne était malade ou non.
• Elles sont influencées notamment par le stade
évolutif de la maladie.
Evaluation des examens
complémentaires
• La valeur prédictive positive (VPP = probabilité d’avoir la
maladie si le test est positif) et la valeur prédictive négative
(VPN = probabilité de ne pas avoir la maladie si le test est
négatif) sont les éléments qui servent à la décision médicale.
• La VPP est la probabilité post-test. Dans le groupe des sujets
ayant un test positif, elle représente la probabilité d’avoir la
maladie.
• Si le généraliste utilise la positivité du test pour adresser les
sujets au spécialiste, la fréquence de la maladie (prévalence)
dans le groupe adressé au spécialiste sera la VPP.
Valeurs prédictives
• Les valeurs prédictives dépendent de :
– La sensibilité du test,
– La spécificité du test,
– La prévalence du test.
• En conséquence, le même test (même
sensibilité et spécificité) aura des VPP et VPN
très différentes en fonction de la prévalence
de la maladie.
Valeurs prédictives
Test Positif
•
•
Sensibilité
VPP et VPN correspondent à
l’inversion du
conditionnement de la
sensibilité et de la spécificité.
L’arbre des probabilités
permet facilement cette
opération.
Malade
Prévalence
1 - Sensibilité
Test Négatif
Test Positif
1 - Prévalence
1 - Spécificité
Non Malade
Spécificité
Test Négatif
VPP 
prévalence * sensibilit é
( prévalence * sensibilté )  (1  prévalence) * (1  spécificit é )
VPN 
(1  prévalence) * ( spécificit é )
(1  prévalence) * ( spécificit é )  ( prévalence) * (1  sensibilté )
VPP et VPN
en fonction de la prévalence
• Pour une sensibilité et
une spécificité donnée :
– Une augmentation de la
prévalence entraîne une
augmentation de la VPP.
– Une augmentation de la
prévalence entraîne une
diminution de la VPN.
1,00
0,90
0,80
0,70
0,60
VPP
VPN
0,50
0,40
0,30
0,20
0,10
0,00
0,00
0,10
0,20
0,30
0,40
0,50
Prévalence
0,60
0,70
0,80
0,90
1,00
Exemple
•
•
•
Le paludisme a une prévalence de 90% en
Afrique et de 0,001 en France. Un test
biologique est utilisé pour le diagnostic
avec une sensibilité de 95% et une
spécificité de 85%. Quelles seront les
probabilités pour des patients Africains et
Français d’avoir le paludisme quand le test
est positif et inversement de ne par avoir la
maladie quand le test est négatif ?
Conclusion : si le test est positif en Afrique,
on est quasiment certain que le patient a le
paludisme alors qu’en France on ne peut
rien conclure. Par contre si le test est
négatif, on est quasiment certain qu’en
France le patient n’a pas de palu alors qu’en
Afrique, on ne peut rien dire.
=> Attention au transfert d’expérience.
VPPAfrique 
0,9 * 0,95
 0,983
0,9 * 0,95  (1  0,9) * (1  0,85)
VPPFrance 
0,001* 0,95
 0,006
0,001* 0,95  (1  0,001) * (1  0,85)
VPN Afrique 
(1  0,9) * 0,85
 0,654
(1  0,9) * 0,85  (0,9 * (1  0,95))
VPNFrance 
(1  0,001) * 0,85
 0,9999
(1  0,001) * 0,85  (0,001* (1  0,95))
Rapports de vraisemblance
Se
• RV+ : L =
1 - Sp
– Un sujet a L fois plus de chance d'avoir le test positif s'il est atteint de la
maladie que dans le cas contraire.
1  Se
• RV- :  
Sp
• L'apport diagnostique d'un résultat positif du test est
d'autant plus grand que le RV+ (L) est plus élevé.
L'apport diagnostique d'un résultat négatif d'autant
plus grand que le RV- est plus petit et proche de zéro.
• B.Grenier
Diagramme de Fagan
• Permet, sans calcul, de
déterminer la probabilité
post-test à partir de la
prévalence (probabilité
pré-test) et du rapport de
vraisemblance.
(source HAS)
Prévalence = 10%
L = 12
Dépistage,
Confirmation diagnostique
•
Dépistage :
– S’adresse à des sujets ne se plaignant de
rien à priori sains.
– Prendre un test à sensibilité élevée (peu de
FN, VPN très grande) .
– Éventuellement suivi d’un test de
confirmation.
– Ne pas oublier les autres éléments :
• Acceptabilité, Risque, Coût
•
Confirmation d’une maladie suspectée :
– Prendre un test avec une spécificité élevée
(peu de FP, VPP très grande) d’autant plus
que le coût du faux positif est élevé.
Maladie +
Maladie -
Total
Test +
A (VP)
B (FP)
T+=A+B=VP+FP
Test -
C (FN)
D (VN)
T-=C+D=FN+VN
Total
M+ = A+C =
VP+FN
M=B+D=FP+VN
N=A+B+C+D
Valeurs diagnostiques d’un test
• Si un test a une spécificité élevée, un résultat positif
confirme l’hypothèse diagnostic.
• Si un test a une sensibilité élevée, un résultat négatif
élimine le diagnostic .
(Règles de Sacket)
• Gain diagnostic positif :
– C’est la différence entre la probabilité pré-test (prévalence)
de la maladie et la probabilité post-test (valeur prédictive
positive).
– Gain positif = VPP – prévalence.
Et si le test consiste à comparer une
valeur quantitative à une limite ?
• Si le résultat du test biologique ou du signe
clinique est une variable quantitative (glycémie diabète; tension artérielle systolique hypertension ...), la sensibilité et la spécificité
vont dépendre du seuil que l'on choisit pour dire
que le test est positif ou négatif.
• Pour chaque valeur de la limite, on aura une
valeur de la sensibilité et une valeur de la
spécificité.
• Ceci conduit à la courbe de ROC.
Spécificité et sensibilité en
fonction de la limite
Ici si l’on déplace la limite
vers la droite, la
spécificité va augmenter
et le sensibilité va
diminuer (diabète et
glycémie par exemple).
Attention, il existe des
cas inverse : taux
d’hormones et
hypothyroidie.
Courbe de ROC
• A chaque valeur de la limite L du
critère quantitatif, on a une valeur de
la sensibilité et de la spécificité.
Sensibilité
1
– On obtient ainsi 1 point de la courbe.
– En faisant varier la limite L, on obtient
d’autres points.
• La courbe joignant les points est la
courbe de ROC.
• Les valeurs de sensibilité et spécificité
en fonction de L peuvent être
obtenues par l’observation ou par la
modélisation du phénomène par une
loi de probabilité.
0
1
1-Spécificité
Courbe de ROC
• Aire sous la courbe : AROC
– Entre 0,5 (examen au hasard : pile ou face)
et 1 (examen parfait).
– Instrument privilégié d’évaluation et de
comparaison des performances
diagnostiques des examens
complémentaires.
Importance de l’indépendance
• Indépendance est opposé à liaison.
– Deux phénomènes sont indépendants si la réalisation
de l’un n’influence pas la réalisation de l’autre.
– Deux phénomènes sont liés si la réalisation de l’un
influence la réalisation de l’autre.
• Attention : Liaison ne veut pas dire causalité.
• Indépendance = hypothèse nulle du test du Khi2
sous laquelle sont calculés les effectifs
théoriques.
Application à la reproductibilité
• Problème fréquent en
santé :
– Deux médecins donnent
un avis sur l’opportunité
de réaliser une
intervention chirurgicale.
– Si la reproductibilité était
parfaite les deux
médecins seraient
toujours d’accord. Mais…
Médecin A
Oui Non Total
Oui
10 20
30
Médecin B
Non
5
45
50
Total 15 65
80
La concordance observée est : (10+45)/80 = 0,69
Reproductibilité
• Si les deux jugements étaient indépendants,
quels auraient été les résultats ?
Oui
15
80
30
P (Oui / B ) 
80
Sous l ' hypothèse d ' indépendan ce
P (Oui / A) 
15 30
P[(Oui / A)]  P[(Oui / B )]  *
80 80
En termes d ' effectifs attendus:
15 30
15 * 30
E  * * 80 
 5,6
80 80
80
Médecin B
Non
Total
Médecin A
Oui Non Total
10
20
30
5
45
50
15
65
80
Les probabilités peuvent être approchées par les
fréquences. Sous l’hypothèse d’indépendance, on
obtient le tableau :
Médecin B
Oui
Non
Total
Médecin A
Oui Non Total
5,6 24,4
30
9,4 40,6
50
15
65
80
Reproductibilité
Concordance observée
Cobs=(10+45)/80 = 0,69
Concordance sous hypothèse
d’indépendance
Cthéo =(5,6+40,6)/80 = 0,58
Coefficient de Kappa
Kappa 
Cobs - C théo 0,69 - 0,58

 0,26
1 - C théo
1 - 0,58
Si Kappa > 0,6 : bonne concordance
Médecin B
Médecin B
Oui
Non
Total
Médecin A
Oui Non Total
10
20
30
5
45
50
15
65
80
Oui
Non
Total
Médecin A
Oui Non Total
5,6 24,4
30
9,4 40,6
50
15
65
80
Application à la survie
• Soit les événements Morts-Vivants
– P(Vivant) = 1 - P(Mort)
– La probabilité d'être vivant au jour J et au jour J+1 est égale au produit des
probabilités d'être vivant au jour J et J+1.
Jour
0
1
6
Exposés
100
100
97
DCD
0
3
2
PDV
0
0
0
P(DCD)
0
0,03
2/97=0,0206
P(Viv.)
1
0,97
0,9794
7
10
95
92
0
…
3
…
0
…
1
…
Pcum(Viv)
1
1*0,97
0,97*0,9794
= 0,95002
0,95002
…
Téléchargement