Travaux dirigés 8 : Tests diagnostiques Exercice 1 : Propriétés diagnostiques, application Article : “Validation of a rapid whole blood test for diagnosing Helicobacter pylori infection” (Moayyedi P. BMJ 1997) Le dépistage de l’infection à Helicobacter pylori permettrait d’éviter l’endoscopie chez les patients séronégatifs. Le test sérologique est habituellement utilisé pour dépister HP mais nécessite une analyse dans un laboratoire centralisé, avec un délai d’attente des résultats. Un nouveau test sanguin rapide a donc été développé pour diagnostiquer en 10 min le statut TD8 Diagnostic – Aspects métrologiques 1 sérologique vis-à vis d’HP. Le but de l’étude est d’évaluer les propriétés diagnostiques de ce test sérologique rapide. 154 patients devant subir une endoscopie de routine ont été inclus. 1) Quel est le gold standard utilisé pour cette évaluation ? Les résultats sont résumés dans le tableau suivant. Rapid whole blood test positive negative Total Gold standard Positive Negative 73 6 10 63 83 69 total 79 73 152 2) Calculer la prévalence de la maladie, 3) Calculer la sensibilité et la spécificité du test et leur intervalle de confiance. 4) Calculer les valeurs prédictives positive et négative du test, et leur intervalle de confiance 5) Calculer les rapports de vraisemblance positif et négatif, et leur intervalle de confiance 6) Calculer l’odds ratio diagnostique et son intervalle de confiance. 7) Qu’apporte le test rapide par rapport à la sérologie ? Exercice 2 : Propriétés diagnostiques – probabilités et aide à la décision Dans une population de patients vus en consultation d’urologie, le toucher rectal a une sensibilité de 86% et une spécificité de 44% pour la détection d’un cancer de la prostate jusqu’alors inconnu. On estime que parmi les hommes âgés de 85 ans ou plus qui viennent consulter, 75% ont un cancer de la prostate (la plupart infraclinique, c’est-à-dire non symptomatique et non détecté). 1. Quel est le rapport de vraisemblance d’un toucher rectal positif ? 2. Quelle est la cote pré-test du cancer de la prostate ? 3. Quelle est la probabilité post-test de cancer de la prostate ? Dans la même population de patients vus en consultation, chez les patients de 60 ans et plus, 3 hommes ont un cancer pour 4 qui n’en ont pas. 4. Quelle est la probabilité a priori d’avoir un cancer chez les patients de plus de 60 ans ? 5. Quelle est la probabilité d’avoir un cancer chez un patient de 60 ans ayant un toucher rectal positif ? 6. Quelle est la probabilité d’avoir un cancer chez un patient de 60 ans ayant un toucher rectal négatif ? Dans la population générale, des hommes de plus de 40 ans asymptomatiques, la prévalence du cancer de la prostate est de 1% 7. Si les sensibilité et spécificité du toucher rectal sont les mêmes que dans la population de consultation d’urologie, parmi les touchers rectaux positifs, (le toucher rectal étant fait en pratique de routine), quelle fraction de faux positifs attendez-vous ? TD8 Diagnostic – Aspects métrologiques 2 Exercice 3 : Concordance entre deux mesures Exemple tiré de Oudkerk et al. Lancet 2002; 359: 1643–47) L’objectif de l’étude est d’évaluer la performance diagnostique de l’angiographie par résonance magnétique avec produit de contraste (AngioIRM) par référence à l’angiographie pulmonaire conventionnelle chez des patients suspects d’embolie pulmonaire (EP). Dans le cadre de cette étude une double lecture des clichés d’AngioIRM a été organisée chez 115 patients. Cette double lecture par deux radiologues indépendants a donné des résultats identiques chez 105 (91%) patients : Tableau 1 Conclusion du radiologue B EP présente EP absente Total Conclusion du radiologue A EP présente EP absente 26 5 5 79 31 84 Total 31 84 115 1) Quel test pouvez-vous utiliser pour évaluer la concordance entre les jugements portés par les 2 radiologues ? 2) Quelle est la concordance observée entre les 2 radiologues 3) Quelle est la concordance « réelle » entre les 2 radiologues ? Comment pouvez-vous la qualifier ? Exercice 4: Propriétés diagnostiques - Seuils Nous sommes au début des années 60. Un médecin responsable d’une unité de soins intensifs cardiologique s’inquiète d’un nombre croissant de demandes d’hospitalisation dans son unité pour suspicion d’infarctus du myocarde. Il pose l’hypothèse selon laquelle la mesure du niveau de CPK dans le sérum peut l’aider à un diagnostic plus précoce que celui d’autres enzymes (ASAT) qui s’élèvent plus tardivement. Il reprend 360 dossiers de son unité et parvient à établir le tableau suivant, les CPK étant mesurées à l’admission en USIC et le diagnostic d’infarctus ayant été infirmé ou confirmé par les données ECG et de suivi. CPK > …(UI/L) 480 440 400 360 320 280 240 200 160 120 80 40 0 Total TD8 Diagnostic – Aspects métrologiques Infarctus présent 35 8 7 15 19 13 18 19 21 30 30 13 2 230 Infarctus absent 0 0 0 1 0 1 1 1 0 5 8 26 88 131 3 1) Si l’on fixe un seuil de CPK à 320 UI/L pour aider au diagnostic d’infarctus et à la décision d’hospitalisation en USIC, quelles seront les sensibilité, spécificité et rapport de vraisemblance positif du test ? 2) Même question avec un seuil de CPK à 200 UI/L et à 80 UI/L 3) Tracer le courbe ROC. Quel est le « meilleur » seuil ? Exercice 5 : Pour évaluer la valeur diagnostique du dosage de la transferrine dans les hépatites alcooliques, 2 groupes de sujets ont été étudiés. Dans un premier échantillon de 15 sujets normaux, indemnes de toute lésion hépatique, les dosages ont donné les résultats suivants: moyenne = 1,9 g/L écart-type = 0,2 g/L. Dans un deuxième échantillon de 14 malades ayant une hépatite alcoolique, les dosages ont donné les résultats suivants: moyenne = 1,3 g/L écart-type = 0,2 g/L. On supposera que la distribution de la transferrine est normale dans les deux groupes. On décide que le test « transferrine » est positif (indique une hépatite alcoolique) quand la valeur dosée est inférieure à 1,5 g/L. Quelle est la sensibilité de ce test ? sa spécificité ? (On raisonnera sur les lois de distributions de la transferrine dans chacun des groupes et on pourra utiliser les approximations z(1-0.05/2) = 2 et z(1-0.30/2) = 1.) Exercice 6 : Reproductibilité de 2 méthodes de mesure Les bonnes pratiques obstétricales requièrent une évaluation fiable de l’âge gestationnel. Les paramètres de biométrie fœtale mesurés au cours du second trimestre de la grossesse ont été démontrés prédictifs de l’âge gestationnel avec une précision de +/-7 jours. La précision de cette estimation reste néanmoins tributaire de la fiabilité de mesures des paramètres biométriques. Perni et al ont conduit une étude prospective avec pour objectif de déterminer la reproductibilité inter-observateur et intra-observateur de la mesure échographique des paramètres de biométrie fœtale (diamètre bipariétal, périmètre abdominal, périmètre céphalique, longueur du fémur). 1) Comment cette étude doit elle être conçue pour répondre à son objectif (quelle type de données, comment les recueillir) ? 2) Un exemple de résultat obtenu dans cette étude concernant la mesure du diamètre bipariétal est le suivant : - échographiste n° 1 : moyenne des mesures = 54,9 mm ; écart-type = 14,85 ; minimum = 29 ; maximum = 97 - échographiste n° 2 : moyenne des mesures = 54.7 mm ; écart-type = 14.88 ; minimum = 29 ; maximum = 97 Comment interpréter ce résultat ? Par quelles analyses faut-il le compléter pour évaluer vraiment la reproductibilité inter et intra-observateur ? 3) Interpréter les figures présentées dans l’article pour la mesure du périmètre abdominal TD8 Diagnostic – Aspects métrologiques 4 Concordance intra-observateur pour la mesure de la circonférence abdominale (AC) AC1 : 1ère mesure, AC2 : 2ème mesure Coefficient de corrélation intraclasse = 0.994 [0.992 ; 0.996] Concordance inter-observateur pour la mesure de la circonférence abdominale (AC) AC1 : 1er observateur 1, AC3 : 2ème observateur Coefficient de corrélation intraclasse = 0.980 [0.971 ; 0.990] TD8 Diagnostic – Aspects métrologiques 5