Nombre de répétitions sur pourcentages en séries appariées
C. LOPEZ - Institut de l'Elevage – Service Biométrie juillet 2002 4
et des probabilités conditionnelles :
P[B absent avec E | B présent avec R] = PFN =
)0(
10
π
π, pourcentage de faux négatifs
P[B présent avec E | B absent avec R] = PFP =
()
)0(
01
1π−
π, pourcentage de faux positifs.
J.J SCHLESSELMAN (1982) propose de prendre une approximation de θ en négligeant
l'appariement sur les échantillons. On obtient alors.
θ ≈ π(0)*(1-π(1)) + (1-π(0))* π(1) [5]
La probabilité de détection avec la méthode de référence R, π(0), est considérée comme
une donnée connue, à tout le moins estimée avec une précision raisonnable.
La probabilité de détection avec la méthode E, π(1), est alors obtenue en fonction de π(0)
et du odds ratio ψm de ces deux probabilités marginales par la relation suivante:
() ()
()
()
11 m*0
0
*m1 −ψπ+
π
ψ=π avec
() ()
() ()
)1(
)1(
00
11
mπ−π
π−π
=ψ [6]
Démonstration:
L'odds ratio ψ s'écrit en fonction des probabilités de détection.
()
()
()
()
()
()
0
0
*m
1
1
11
π
π
ψ
π
π
−
=
−
où encore
() ()
()
() ()
()
1*0*m0*1 11
ππψππ
−=−
Soit
() () ()
()
()
0*m0*m0*1 1
πψπψππ
=+−
On en déduit l'expression [6].
Cette façon de faire ne semble pas devoir être conseillée. L'hypothèse d'indépendance
associée à l'approximation [6] implique en effet des probabilités de discordances
incompatibles avec l'odds ratio ψa fixé à l’étape 1 pour déterminer m.
Le nombre total d'échantillons N ne peut être estimé sans faire des hypothèses
préalables sur les taux d'erreur de diagnostic comme va le montrer l'exemple suivant.
Un exemple … à ne pas suivre …
Supposons que nous voulions détecter des écarts de 3 points (3%) entre les prévalences
π(1) et π(0) avec une probabilité estimée pour la méthode de référence de π(0) = 0,11.
Raisonnons aux risques α =0,05 et β = 0,10. On se fixe comme hypothèse de détecter un
odds ratio ψa =1/4, c'est-à-dire un nombre de faux positifs 4 fois plus faible que le
nombre de faux négatifs. La probabilité P est alors égale à 5
1
)4/1(1
4/1
P=
+
= et
l'expression [2] donne un nombre d'échantillons discordants égal à m=25.