26/01/12 Typ : Maxence, Samah/ Cor : Catherine PROCEDURES D E D I A G N O S T I C E T D E D E P I S TA G E Il est nécessaire de définir les caractéristiques intrinsèques des tests qu’ils soient diagnostic ou de dépistage. Définition : Un test diagnostique (ou dépistage) doit être évalué avant d’en envisager l’utilisation pratique. Cette évaluation se fera par rapport à un ou des examens de référence (gold standard) afin de voir si ce nouvel examen apporte des améliorations. Il faut donc disposer d’un examen de référence : gold standard = test parfait, capable d’identifier sans erreur les sujets malades des sujets sains en fonction de l’utilisation envisagé de ce test (diagnostic ou dépistage) on peut être amené à privilégier certaines propriétés du test par rapport à d’autres. Certains test peuvent être très efficaces dans le cadre du diagnostic et pas du tout intéressants dans une démarche de dépistage et inversement. Exemple : déterminer les caractéristiques d’un test de dépistage-diagnostic d’un cancer : gold standard = examen anatomopathologie pour les besoins de l’évaluation, on va soumettre les sujets au test de référence (AP) et au test évalué I. Caractéristiques d ’un test Intrinsèques : propres au test Vont permettre de retenir ou non le test dans la démarche sensibilité, spécificité et rapport de vraisemblance mesuré Extrinsèques : liées aux conditions d’utilisation du test (lié à la prévalence de la maladie : un test aura une utilisation différente si la maladie est très présente ou non dans une population) 4 critères de qualité d’un test : reproductibilité information valide qualités intrinsèques et extrinsèques efficace pour le malade et la population Interprétation reproductible Reproductibilité de l’examen : au même endroit ou dans des lieux différents si les conditions changent. Reproductibilité du jugement : variabilité inter et intra-observateur → coefficient d’agrément Kappa Coefficient d’agrément de Kappa : index utilisé pour mesurer l’agrément entre plusieurs observateurs (exemple : si deux observateurs voient la même lésion) varie de -1 à +1 tend vers -1 : discordance d’interprétation entre les observateurs tend vers +1 : concordance d’interprétation importante Observateur 2 Observateur 1 Présent Absent Total Présent a b P1 = a+b Abs c d Q1 = c+d Total P2 = a+ c Q2 = b+d N = a+b+c+d –1– /9 → P0 = proportion d’agrément observé = (a+d)/n (résultats avec accord entre les deux lecteurs → même conclusion) → Pe = proportion d’agrément attendu = ((P1 x P2) + (Q1 x Q2)) / n (si les auteurs étaient d’accord sur toutes les interprétations des résultats) → Kappa = (P0 – Pe) / (1 – Pe) Inconvénient : dépend de la prévalence de la maladie Information valide Problème de la valeur-seuil d’un examen : laquelle ? +++ (valeur à partir de laquelle le test est positif) Examen clinique donne une estimation des « chances » qu’a le sujet d’être atteint de la maladie : probabilité d’être malade Examen complémentaire : modifie les probabilités en estimant en fonction des résultats le risque d’être malade ou pas : dépend des qualités intrinsèques du test (sensibilité et spécificité) dépend de la prévalence de la maladie +++ 1. Définition du seuil du test o Variable qualitative : présence ou absence → positif ou négatif (exemple : test haemoccult → présence ou absence de sang dans les selles) o Variable quantitative : à partir de quelle valeur d’un dosage on considèrera le dosage positif (exemple : test de mise en évidence d’une glycémie conforme, élevée ou diminuée. Il est alors nécessaire d’avoir un seuil afin de comparer le résultat). 2. Étude diagnostique - o sensibilité/ spécificité pour test qualitatif : test(+) / test (-) ne dépend pas de la prévalence de la maladie - o valeurs prédictives négative positive dépendent de la prévalence de la maladie - o courbe ROC (receiver operating characteristics) pour test quantitatif (seuils, gradation….) alternative : donne la sensibilité et le spécificité pour tous les seuils = si le patient est malade, que détecte le test ? VP = si le test est (+), est-ce que le patient est malade ? Questions à se poser : quelle est la probabilité d’avoir un test (+) si je suis malade ? (probabilité maximale) quelle est la probabilité d’avoir un test (-) si je ne suis pas malade ? quelle est la probabilité que je sois malade si j’ai un test (+) ? Caractéristique intrinsèque : test binaire Un échantillon de patients qui subissent à la fois le test de diagnostic et le test de référence. Les patients sont donc classés en malades ou en non malades avec le test de référence et positif ou négatif avec le test diagnostique. –2– /9 1. Table de contingence Echantillon total Maladie + = (a+c) Maladie - = (b+d) Prévalence = (a+c)/ (a+b+c+d) Test + = (a+b) Vrais positifs (VP) Faux positifs (FP) Valeur prédictive + = a/(a+b) Test - = (c+d) Faux négatifs (FN) Vrai négatifs (VN) Valeur prédictive - = d/(c+d) Se = a/(a+c) Sp = d/(b+d) Si ce tableau ne peut être construit à partir des données fournies, l’étude est inutile. a. Sensibilité Se : Il s’agit de la capacité d’un test à mettre en évidence les sujets malades (test + chez les M+) : Se = a/(a+c) Plus la sensibilité est basse, moins le test est bon. - elle n’est pas influencée par la prévalence de la maladie dans la population où il est réalisé. La Se mesure la capacité d’un test à bien identifier les malades. Elle correspond à la probabilité d’avoir un test positif chez un malade. Elle est exprimée par la proportion de VP chez les malades soit : Se = VP / (VP + FN) Exemple : cancer colorectal (diagnostic histologique) Oui Non Saignement Oui 82 1505 rectal Non 13 668 95 2173 Sensibilité = P(saignement/malade) = 82 / (82 + 13) = 86,3 % b. Spécificité Sp : Échantillon total Maladie + (a+c) Maladie – (b+d) Test + (a+b) VP (a) FP (b) Test – (c+d) FN (c) VN (d) Elle n’est pas influencée par la prévalence de la maladie dans la population où le test est réalisé. La spécificité mesure la capacité d’un test à bien classer les patients indemnes de la maladie. Elle correspond à la probabilité d’avoir un test négatif chez un sujet sain. Elle est exprimée par la proportion de VN chez les sujets sains, soit : –3– /9 Sp = VN/VN+FP Exemple : cancer colorectal (diagnostic histologique) le même que précédemment Spécificité = P(absence de saignement/sain) = 668 / 668 + 1505 = 30,7% Cependant, la Se et la Sp ne permettent pas de répondre à la question implicitement posée par le clinicien lorsqu’il prescrit un test biologique : quelle est la probabilité que le patient soit malade si le test est positif et qu’il soit indemne si le test est négatif ? Les valeurs prédictives positives et négatives procurent cette information = probabilité post-test. Les valeurs prédictives sont liées à la prévalence de la maladie = probabilité pré-test. Ces deux valeurs vont bouger en fonction de la prévalence. Il vaut mieux les utiliser dans un test où elle est élevée. Prévalence = (a+c)/(a+b+c+d) Valeur prédictive positive = a/(a+b) Valeur prédictive négative = d/(c+d) VPP/VPN : calculs : VPP = VP/ VP + FP = P(malades/Test+) VPN = VN/FN+VN = P(sains/Test-) La notion d’utilisation de ce test : la VPN et la VPP sont étroitement liées à la prévalence, elles doivent être évaluées dans une population où la prévalence est importante. Malades Sains Test + VP FP Test - FN VN VPP = P(malades/test+) = VP / (VP+FP) VPN = P(Sains/test-)= VN / (VN+FN) Lorsque la prévalence est relativement élevée (30%), chez les 2200 personnes, on s’attend à ce qu’il y ait le tiers portant la maladie. 581 personnes sont susceptibles de porter la maladie. La VPP passe à 34,5%. La VPP ici a fortement augmenté parce que la prévalence de la pathologie est importante. La probabilité post-test ne sera pas la même. Exemple : * Avec N = 2268 (population à risque) et prévalence = 4,2% Saignement rectal + Saignement rectal - Cancer 82 13 Sains 1505 668 VPP = 82/(82+1505) = 5 ,2% VPN = 668/(668+13) = 98,1% Près de 5% des patients auront une tumeur colorectale → Se = 86,3% → Sp = 30,7% –4– /9 * Avec N = 2268 et prévalence = 29,7% Saignement rectal + Saignement rectal - Cancer 581 92 Sains 1105 490 VPP = 581/(581+1505) = 34,5% VPN = 490/(490+92) = 84,2% → Se et Sp restent inchangés → VPN augmente +++ → VPN relativement identique 2. Indépendance/dépendance des indices La VPP et la VPN sont dépendants de la prévalence. On devra faire le test sur une population où la prévalence est élevée. Les facteurs intrinsèques (sensibilité et spécificité) dépendent du test diagnostique. Quelle que soit la population, ce seront les mêmes valeurs. Ils sont totalement indépendants de la prévalence. La valeur globale du test est : (a+d) / (a+b+c+d) II. Indices de synthèse Ils visent à établir la valeur d’un test : exactitude test de Youden Rapport de vraisemblance A. Exactitude C’est la proportion de bien classés, le pourcentage de résultats exacts, c’est-à-dire VP et VN par rapport à la cohorte : varie de 0 à 1 1 correspondant à une absence de FP et FN Indice de Youden (J) Il s’agit de l’addition des deux qualités intrinsèques du test (Sp et Se). Il est exprimé en pourcentage, il s’agit de : J = Se + Sp – 100 Varie de -1 à 1 0 : pas d’orientation diagnostique cet indice est peu utilisé exemple : 87 + 31 -100 = 18 % indice très faible traduisant que le test haemoccult est relativement peu intéressant Rapports de vraisemblance (likelihood ratio) Ils expriment la probabilité d’avoir un test positif chez les malades et la probabilité d’avoir un test négatif chez les non malades. Ils sont calculés à partir de la Se et de la Sp, ils sont indépendants de la prévalence de la maladie +++ 1. Rapports de vraisemblance positifs : c’est la vraisemblance que le sujet soit malade lorsque le test est positif il s’exprime naturellement comme le rapport des taux des tests positifs chez les malades (VP/M+) sur les tests positifs chez les non-malades (FP/M-) LR+ = taux des vrais positifs/taux des faux positifs = Se/(1-Sp) Ce rapport positif varie de 0 (sensibilité nulle) à l’infini (spécificité tend vers 1) –5– /9 - - Plus RV s’écarte de la valeur 1 plus le test apporte des informations intéressantes 1. Rapports de vraisemblance négatifs : c’est la vraisemblance que le sujet soit non malade quand le test est négatif il s’exprime naturellement comme le rapport des tests négatifs chez les malades sur les tests négatifs chez les nonmalades LR- = taux des FN/taux des VN = 1-Se/Sp Ce rapport négatif est nul quand la sensibilité est égale à 1 Quand le test est totalement spécifique (pathognomonique), le rapport de vraisemblance négatif est égal à 1-Se Rapport de vraisemblance positif Rapport de vraisemblance négatif Apport diagnostique >10 <0,1 Très fort 5-10 0,1-0,2 Fort 2-5 0,2-0,5 Modéré 1-2 0,5-1 Faible 1 1 nul Plus le rapport de vraisemblance positif est élevé et plus le rapport de vraisemblance négatif est faible, plus le gain diagnostique est important. La déduction sera que le test sera bon. Des RV+ >10 et RV-<0,1 permettent de confirmer ou d’exclure la maladie le plus souvent. Test quantitatif : situation idéale Il faut trouver le test permettant de définir avec précision quand le patient sera malade ou non. Démarche de fixer un seuil de valeurs → test mesurant variable de type quantitatif. Discrimination parfaite : toutes les personnes au dessus ne seront pas malades, toutes les personnes en dessous le seront. Le test que l’on va utiliser va avoir une Se de 100% et une Sp de 100%. Les malades seront les VP et les sujets sains les VN. Situation parfaite jamais rencontrée. En pratique : Distribution des valeurs chez nos malades et nos sujets sains qui vont se chevaucher. La zone de discrimination ne sera pas retrouvée. Le but va être de trouver une valeur qui va le mieux discriminer. La valeur seuil ne sera pas la même en terme de résultats. –6– /9 Test sensible Cette valeur est intéressante parce qu’elle permet de détecter tous les malades (FN = 0) mais augmente le nombre de FP. La valeur seuil est intéressante parce que l’on trouve tous les malades mais non intéressante parce que l’on a une Sp biaisée. Test spécifique Écarte tous les sujets sains (FP =0) mais augmente les FN. Tous les patients non malades auront un test négatif, mais la moitié des sujets malades auront un test négatif. Il y a toujours un lien très étroit entre Se et Sp, on doit trouver la valeur seuil où la Se et la Sp sont les plus élevées. Exemple : D-dimer pour diagnostic d’embolie pulmonaire PE + PE - D-dimer + 196 470 D-dimer - 0 5 Total 196 475 Se = 1 et Sp = 0,01 Test non intéressant. Ce seuil n’est pas bon pour discriminer ceux qui ont une embolie. On rejette ce seuil, on fixe un autre seuil à 500 microg/L –7– /9 PE+ PE- D-dimer + 195 278 D-dimer - 1 197 Total 196 475 Se = 0,995 et Sp = 0,414 La fixation du seuil à 500 est meilleure pour diagnostiquer une embolie pulmonaire. Comment déterminer le seuil optimal ? Courbes ROC : receiver operating characteristics - permettent de déterminer le seuil optimal +++ étudient les variations de spécificité et sensibilité d’un test pour différentes valeurs du seuil de discrimination Exemple : courbe ROC D-dimer > Se Sp 100 100 1,1 200 100 13,7 300 100 24,8 400 99,5 34,9 500 99,5 41,4 600 95,4 49,9 On va construire la courbe ROC en tenant compte de la sensibilité et de la spécificité (1-Sp) –8– /9 On aboutit à une courbe = courbe ROC qui est ici construite en fonction des valeurs mesurées pour chacune des valeurs seuils que l’on a testé. Une fois que l’on a reporté sur cette courbe ROC chacune des valeurs, la question est quelle est la valeur que l’on va retenir ? La valeur que l’on va retenir est la valeur la plus proche du sommet. Courbe ROC : AUC (area under ROC curve) - AUC = 1 si test parfait (Se = 1 et Sp = 1) AUC = 0,5 si test non discriminant Pour qu’un test soit robuste, il faut que AUC>0,8 (traduit une courbe qui se rapproche du test parfait). Plus la courbe se rapproche du sommet (courbe de test parfait), plus AUC tend vers 1, plus le test est discriminant. –9– /9