Procédures de diagnostic et de dépistage

publicité
26/01/12
Typ : Maxence, Samah/ Cor : Catherine
PROCEDURES
D E D I A G N O S T I C E T D E D E P I S TA G E
Il est nécessaire de définir les caractéristiques intrinsèques des tests qu’ils soient diagnostic ou de dépistage.
Définition :
Un test diagnostique (ou dépistage) doit être évalué avant d’en envisager l’utilisation pratique.
Cette évaluation se fera par rapport à un ou des examens de référence (gold standard) afin de voir si ce nouvel examen apporte
des améliorations.
Il faut donc disposer d’un examen de référence :
gold standard = test parfait, capable d’identifier sans erreur les sujets malades des sujets sains
en fonction de l’utilisation envisagé de ce test (diagnostic ou dépistage) on peut être amené à privilégier certaines
propriétés du test par rapport à d’autres. Certains test peuvent être très efficaces dans le cadre du diagnostic et pas du
tout intéressants dans une démarche de dépistage et inversement.
Exemple : déterminer les caractéristiques d’un test de dépistage-diagnostic d’un cancer :
gold standard = examen anatomopathologie
pour les besoins de l’évaluation, on va soumettre les sujets au test de référence (AP) et au test évalué
I. Caractéristiques d ’un test
Intrinsèques : propres au test
Vont permettre de retenir ou non le test dans la démarche
sensibilité, spécificité et rapport de vraisemblance mesuré
Extrinsèques : liées aux conditions d’utilisation du test (lié à la prévalence de la maladie : un test aura une utilisation différente si
la maladie est très présente ou non dans une population)
4 critères de qualité d’un test :
reproductibilité
information valide
qualités intrinsèques et extrinsèques
efficace pour le malade et la population
Interprétation reproductible
Reproductibilité de l’examen : au même endroit ou dans des lieux différents si les conditions changent.
Reproductibilité du jugement : variabilité inter et intra-observateur → coefficient d’agrément Kappa
Coefficient d’agrément de Kappa :
index utilisé pour mesurer l’agrément entre plusieurs observateurs (exemple : si deux observateurs voient la même
lésion)
varie de -1 à +1
tend vers -1 : discordance d’interprétation entre les observateurs
tend vers +1 : concordance d’interprétation importante
Observateur 2
Observateur 1
Présent
Absent
Total
Présent
a
b
P1 = a+b
Abs
c
d
Q1 = c+d
Total
P2 = a+ c
Q2 = b+d
N = a+b+c+d
–1– /9
→ P0 = proportion d’agrément observé = (a+d)/n
(résultats avec accord entre les deux lecteurs → même conclusion)
→ Pe = proportion d’agrément attendu = ((P1 x P2) + (Q1 x Q2)) / n
(si les auteurs étaient d’accord sur toutes les interprétations des résultats)
→ Kappa = (P0 – Pe) / (1 – Pe)
Inconvénient : dépend de la prévalence de la maladie
Information valide
Problème de la valeur-seuil d’un examen : laquelle ? +++
(valeur à partir de laquelle le test est positif)
Examen clinique donne une estimation des « chances » qu’a le sujet d’être atteint de la maladie : probabilité d’être malade
Examen complémentaire : modifie les probabilités en estimant en fonction des résultats le risque d’être malade ou pas :
dépend des qualités intrinsèques du test (sensibilité et spécificité)
dépend de la prévalence de la maladie +++
1. Définition du seuil du test
o
Variable qualitative : présence ou absence → positif ou négatif (exemple : test haemoccult → présence ou
absence de sang dans les selles)
o
Variable quantitative : à partir de quelle valeur d’un dosage on considèrera le dosage positif (exemple : test de
mise en évidence d’une glycémie conforme, élevée ou diminuée. Il est alors nécessaire d’avoir un seuil afin de
comparer le résultat).
2. Étude diagnostique
-
o sensibilité/ spécificité
pour test qualitatif : test(+) / test (-)
ne dépend pas de la prévalence de la maladie
-
o valeurs prédictives
négative
positive
dépendent de la prévalence de la maladie
-
o courbe ROC (receiver operating characteristics)
pour test quantitatif (seuils, gradation….)
alternative : donne la sensibilité et le spécificité pour tous les seuils
= si le patient est malade, que détecte le test ?
VP = si le test est (+), est-ce que le patient est malade ?
Questions à se poser :
quelle est la probabilité d’avoir un test (+) si je suis malade ? (probabilité maximale)
quelle est la probabilité d’avoir un test (-) si je ne suis pas malade ?
quelle est la probabilité que je sois malade si j’ai un test (+) ?
Caractéristique intrinsèque : test binaire
Un échantillon de patients qui subissent à la fois le test de diagnostic et le test de référence.
Les patients sont donc classés en malades ou en non malades avec le test de référence et positif ou négatif avec le test
diagnostique.
–2– /9
1. Table de contingence
Echantillon total
Maladie + = (a+c)
Maladie - = (b+d)
Prévalence = (a+c)/
(a+b+c+d)
Test + = (a+b)
Vrais positifs (VP)
Faux positifs (FP)
Valeur prédictive + =
a/(a+b)
Test - = (c+d)
Faux négatifs (FN)
Vrai négatifs (VN)
Valeur prédictive - =
d/(c+d)
Se = a/(a+c)
Sp = d/(b+d)
Si ce tableau ne peut être construit à partir des données fournies, l’étude est inutile.
a. Sensibilité Se :
Il s’agit de la capacité d’un test à mettre en évidence les sujets malades (test + chez les M+) :
Se = a/(a+c)
Plus la sensibilité est basse, moins le test est bon.
-
elle n’est pas influencée par la prévalence de la maladie dans la population où il est réalisé.
La Se mesure la capacité d’un test à bien identifier les malades. Elle correspond à la probabilité d’avoir un test positif
chez un malade.
Elle est exprimée par la proportion de VP chez les malades soit :
Se = VP / (VP + FN)
Exemple : cancer colorectal (diagnostic histologique)
Oui
Non
Saignement
Oui
82
1505
rectal
Non
13
668
95
2173
Sensibilité = P(saignement/malade)
= 82 / (82 + 13) = 86,3 %
b. Spécificité Sp :
Échantillon total
Maladie + (a+c)
Maladie – (b+d)
Test + (a+b)
VP (a)
FP (b)
Test – (c+d)
FN (c)
VN (d)
Elle n’est pas influencée par la prévalence de la maladie dans la population où le test est réalisé. La spécificité mesure la capacité
d’un test à bien classer les patients indemnes de la maladie. Elle correspond à la probabilité d’avoir un test négatif chez un sujet
sain.
Elle est exprimée par la proportion de VN chez les sujets sains, soit :
–3– /9
Sp = VN/VN+FP
Exemple : cancer colorectal (diagnostic histologique) le même que précédemment
Spécificité = P(absence de saignement/sain)
= 668 / 668 + 1505 = 30,7%
Cependant, la Se et la Sp ne permettent pas de répondre à la question implicitement posée par le clinicien lorsqu’il prescrit un
test biologique : quelle est la probabilité que le patient soit malade si le test est positif et qu’il soit indemne si le test est
négatif ?
Les valeurs prédictives positives et négatives procurent cette information = probabilité post-test.
Les valeurs prédictives sont liées à la prévalence de la maladie = probabilité pré-test.
Ces deux valeurs vont bouger en fonction de la prévalence. Il vaut mieux les utiliser dans un test où elle est élevée.
Prévalence = (a+c)/(a+b+c+d)
Valeur prédictive positive = a/(a+b)
Valeur prédictive négative = d/(c+d)
VPP/VPN : calculs :
VPP = VP/ VP + FP = P(malades/Test+)
VPN = VN/FN+VN = P(sains/Test-)
La notion d’utilisation de ce test : la VPN et la VPP sont étroitement liées à la prévalence, elles doivent être évaluées dans une
population où la prévalence est importante.
Malades
Sains
Test +
VP
FP
Test -
FN
VN
VPP = P(malades/test+) = VP / (VP+FP)
VPN = P(Sains/test-)= VN / (VN+FN)
Lorsque la prévalence est relativement élevée (30%), chez les 2200 personnes, on s’attend à ce qu’il y ait le tiers portant la
maladie. 581 personnes sont susceptibles de porter la maladie. La VPP passe à 34,5%. La VPP ici a fortement augmenté parce que
la prévalence de la pathologie est importante. La probabilité post-test ne sera pas la même.
Exemple :
*
Avec N = 2268 (population à risque) et prévalence = 4,2%
Saignement rectal +
Saignement rectal -
Cancer
82
13
Sains
1505
668
VPP = 82/(82+1505) = 5 ,2%
VPN = 668/(668+13) = 98,1%
Près de 5% des patients auront une tumeur colorectale
→ Se = 86,3%
→ Sp = 30,7%
–4– /9
*
Avec N = 2268 et prévalence = 29,7%
Saignement rectal +
Saignement rectal -
Cancer
581
92
Sains
1105
490
VPP = 581/(581+1505) = 34,5%
VPN = 490/(490+92) = 84,2%
→ Se et Sp restent inchangés
→ VPN augmente +++
→ VPN relativement identique
2. Indépendance/dépendance des indices
La VPP et la VPN sont dépendants de la prévalence. On devra faire le test sur une population où la prévalence est élevée.
Les facteurs intrinsèques (sensibilité et spécificité) dépendent du test diagnostique. Quelle que soit la population, ce seront les
mêmes valeurs. Ils sont totalement indépendants de la prévalence.
La valeur globale du test est : (a+d) / (a+b+c+d)
II. Indices de synthèse
Ils visent à établir la valeur d’un test :
exactitude
test de Youden
Rapport de vraisemblance
A. Exactitude
C’est la proportion de bien classés, le pourcentage de résultats exacts, c’est-à-dire VP et VN par rapport à la cohorte :
varie de 0 à 1
1 correspondant à une absence de FP et FN
Indice de Youden (J)
Il s’agit de l’addition des deux qualités intrinsèques du test (Sp et Se). Il est exprimé en pourcentage, il s’agit de :
J = Se + Sp – 100
Varie de -1 à 1
0 : pas d’orientation diagnostique
cet indice est peu utilisé
exemple : 87 + 31 -100 = 18 % indice très faible traduisant que le test haemoccult est relativement peu intéressant
Rapports de vraisemblance (likelihood ratio)
Ils expriment la probabilité d’avoir un test positif chez les malades et la probabilité d’avoir un test négatif chez les non malades.
Ils sont calculés à partir de la Se et de la Sp, ils sont indépendants de la prévalence de la maladie +++
1. Rapports de vraisemblance positifs :
c’est la vraisemblance que le sujet soit malade lorsque le test est positif
il s’exprime naturellement comme le rapport des taux des tests positifs chez les malades (VP/M+) sur les tests positifs
chez les non-malades (FP/M-)
LR+ = taux des vrais positifs/taux des faux positifs = Se/(1-Sp)
Ce rapport positif varie de 0 (sensibilité nulle) à l’infini (spécificité tend vers 1)
–5– /9
-
-
Plus RV s’écarte de la valeur 1 plus le test apporte des informations intéressantes
1. Rapports de vraisemblance négatifs :
c’est la vraisemblance que le sujet soit non malade quand le test est négatif
il s’exprime naturellement comme le rapport des tests négatifs chez les malades sur les tests négatifs chez les nonmalades
LR- = taux des FN/taux des VN = 1-Se/Sp
Ce rapport négatif est nul quand la sensibilité est égale à 1
Quand le test est totalement spécifique (pathognomonique), le rapport de vraisemblance négatif est égal à 1-Se
Rapport de vraisemblance positif
Rapport de vraisemblance négatif
Apport diagnostique
>10
<0,1
Très fort
5-10
0,1-0,2
Fort
2-5
0,2-0,5
Modéré
1-2
0,5-1
Faible
1
1
nul
Plus le rapport de vraisemblance positif est élevé et plus le rapport de vraisemblance négatif est faible, plus le gain diagnostique
est important. La déduction sera que le test sera bon.
Des RV+ >10 et RV-<0,1 permettent de confirmer ou d’exclure la maladie le plus souvent.
Test quantitatif : situation idéale
Il faut trouver le test permettant de définir avec précision quand le patient sera malade ou non. Démarche de fixer un seuil de
valeurs → test mesurant variable de type quantitatif.
Discrimination parfaite : toutes les personnes au dessus ne seront pas malades, toutes les personnes en dessous le seront. Le test
que l’on va utiliser va avoir une Se de 100% et une Sp de 100%. Les malades seront les VP et les sujets sains les VN. Situation
parfaite jamais rencontrée.
En pratique :
Distribution des valeurs chez nos malades et nos sujets sains qui vont se chevaucher. La zone de discrimination ne sera pas
retrouvée. Le but va être de trouver une valeur qui va le mieux discriminer. La valeur seuil ne sera pas la même en terme de
résultats.
–6– /9
Test sensible
Cette valeur est intéressante parce qu’elle permet de détecter tous les malades (FN = 0) mais augmente le nombre de FP. La
valeur seuil est intéressante parce que l’on trouve tous les malades mais non intéressante parce que l’on a une Sp biaisée.
Test spécifique
Écarte tous les sujets sains (FP =0) mais augmente les FN. Tous les patients non malades auront un test négatif, mais la moitié des
sujets malades auront un test négatif.
Il y a toujours un lien très étroit entre Se et Sp, on doit trouver la valeur seuil où la Se et la Sp sont les plus élevées.
Exemple : D-dimer pour diagnostic d’embolie pulmonaire
PE +
PE -
D-dimer +
196
470
D-dimer -
0
5
Total
196
475
Se = 1 et Sp = 0,01
Test non intéressant. Ce seuil n’est pas bon pour discriminer ceux qui ont une embolie.
On rejette ce seuil, on fixe un autre seuil à 500 microg/L
–7– /9
PE+
PE-
D-dimer +
195
278
D-dimer -
1
197
Total
196
475
Se = 0,995 et Sp = 0,414
La fixation du seuil à 500 est meilleure pour diagnostiquer une embolie pulmonaire.
Comment déterminer le seuil optimal ?
Courbes ROC : receiver operating characteristics
-
permettent de déterminer le seuil optimal +++
étudient les variations de spécificité et sensibilité d’un test pour différentes valeurs du seuil de discrimination
Exemple : courbe ROC
D-dimer >
Se
Sp
100
100
1,1
200
100
13,7
300
100
24,8
400
99,5
34,9
500
99,5
41,4
600
95,4
49,9
On va construire la courbe ROC en tenant compte de la sensibilité et de la spécificité (1-Sp)
–8– /9
On aboutit à une courbe = courbe ROC qui est ici construite en fonction des valeurs mesurées pour chacune des valeurs seuils que
l’on a testé.
Une fois que l’on a reporté sur cette courbe ROC chacune des valeurs, la question est quelle est la valeur que l’on va retenir ?
La valeur que l’on va retenir est la valeur la plus proche du sommet.
Courbe ROC :
AUC (area under ROC curve)
-
AUC = 1 si test parfait (Se = 1 et Sp = 1)
AUC = 0,5 si test non discriminant
Pour qu’un test soit robuste, il faut que AUC>0,8 (traduit une courbe qui se rapproche du test parfait).
Plus la courbe se rapproche du sommet (courbe de test parfait), plus AUC tend vers 1, plus le test est discriminant.
–9– /9
Téléchargement