Benford (loi de) 17
© Dunod – La photocopie non autorisée est un délit.
ABCDE FGH I J K LMNOPQR STUVWXY Z
Ce tableau est complété par les probabilités « marginales », et on peut calculer notamment
P(test –) = P(S et test –) + P(A et test –) = 0,9336 (somme par colonne) et de même P(test +)
= 0,0664. On peut alors calculer les probabilités conditionnelles demandées :
,
valeur à comparer avec la probabilité a priori 0,06 d’être porteur de A, et :
,
valeur à comparer avec la probabilité a priori 0,94 d’être sain.
Exemple 2 On considère une usine où trois machines fabriquent un même modèle de pièce.
40 % des pièces sont fabriquées par la machine A, qui produit 0,1 % de pièces défectueuses ;
30 % des pièces sont fabriquées par la machine B, plus ancienne, qui produit 0,3 % de pièces
défectueuses ; 30 % des pièces sont fabriquées par la machine C, encore plus ancienne, qui
produit 0,8 % de pièces défectueuses. On demande la probabilité conditionnelle qu’une pièce
ait été fabriquée par la machine C, sachant qu’elle est défectueuse.
Appelons A l’évènement « une pièce prise au hasard a été fabriquée par la machine A », B et
C les évènements analogues pour les machines B et C. Appelons D l’évènement « une pièce
prise au hasard est défectueuse ». Il faut commencer par traduire les pourcentages en proba-
bilités et en probabilités conditionnelles :
P(A) = 0,4, P(B) = 0,3, P(C) = 0,3,
P(D|A) = 0,001, P(D| B) = 0,003, P(D|C) = 0,008.
On peut alors calculer le dénominateur de la formule de Bayes
P(D) = P(A)P(D| A) + P(B)P(D| B) + P(C)P(D| C)
= 0,4 × 0,001 + 0,3 × 0,003 + 0,3 × 0,008 = 0,0037.
Et on a enfin :
On voit ainsi que, pour employer un vocabulaire ancien, la probabilité a priori qu’une pièce
(prise au hasard) ait été fabriquée par C est 0,30, et que la probabilité a posteriori qu’elle ait
été fabriquée par C sachant qu’elle est défectueuse passe à 0,65.
Voir conditionnelle (probabilité).
Benford (loi de) (Benford distribution)
Loi empirique qui régit la distribution du premier chiffre des nombres pris dans des ensem-
bles de données présentant des grandes variations d’échelle. Cette loi a été découverte en
1881 par l’astronome S. Newcomb et redécouverte en 1938 par le physicien F. Benford. Elle
énonce que la probabilité d’apparition du premier chiffre significatif k d’un nombre (écrit en
base 10) est :
P(k) =
En particulier P(1) = 0,301 ≈ 30 %. L’une des justifications mathématiques de cette loi est
son invariance par un changement arbitraire d’unité de mesure.
➤Utilisation
Cette loi a été utilisée dans les années 1990 pour détecter des fraudes comptables par utilisa-
tion de données inventées.
PAtest +()
PA et test +()
Ptest +()
--------------------------------- 0,0570
00664,
------------------0,86≈==
PStest –()
PS et test +()
Ptest –()
-------------------------------- 0,9306
0,9336
---------------- 0,997≈==
PCD()
PC()PDC()
PD()
--------------------------------0,0024
0,0037
---------------- 0,65===
log10 11
k
---+
3 Dress_B Page 17 Samedi, 28. août 2004 11:21 11