© Dunod – La photocopie non autorisée est un délit.
ABCDE FGH I J K LMNOPQRS TUVWXY Z
Bartlett (test de)
(Bartlett test)
Test d’hypothèse paramétrique utilisé pour comparer les variances observées de plusieurs
échantillons statistiques.
test de comparaison de
q
variances
Données.
q
séries ou groupes, avec pour chaque
k
(1
k
q
) : un échantillon de
n
k
valeurs
observées d’une variable aléatoire numérique X
k
d’espérance mathématique
µ
k
et de
variance .
On note
N
le nombre total de valeurs observées
n
1
+
n
2
+ ...+
n
q
.
Hypothèse testée. H
0
= « = = ... = » contre H
1
= « il existe au moins deux
varian-ces différentes ».
• Déroulement technique du test
1. On calcule, avec les formules usuelles, la moyenne puis la variance débiaisée de
l’échantillon n°
k
.
2. On calcule une estimation commune de toutes les variances :
.
3. On calcule la valeur observée de la variable de test :
.
Les valeurs de référence de la variable de test sont à lire dans les tables de la loi du khi-
deux à
q
1 degrés de liberté, pour le risque
unilatéral
α
(qui est le risque standard des
tables du khi-deux).
• Conditions et précautions
Ce test n’est pas robuste : il n’est valable que dans le cas où les lois des échantilons sont
toutes normales ;
il est prudent de demander que chaque effectif
n
k
soit
5.
Il est parfois conseillé de diviser la variable de test
t
par le facteur correctif :
.
Remarque :
si
q
= 2, ce test n’est pas équivalent au test du quotient des variances
(sauf si les effectifs sont égaux).
σ1
2σ2
2…σ
q
2
,,,
σk
2
σ1
2σ2
2σq
2
sk
2
s2n11()s1
2n21()s2
2nq1()sq
2
+++
Nq
--------------------------------------------------------------------------------------------------=
tNq()s2nk1()sk
2
ln
k1=
q
ln=
C11
3q1()
--------------------1
nk1
--------------
k1=
q



1
N
----



+=
3 Dress_B Page 15 Samedi, 28. août 2004 11:21 11
16
Bayes (formule de), Bayes (théorème de)
Bayes (formule de), Bayes (théorème de)
(Bayes formula, Bayes
theorem)
Nom d’une formule – ou théorème – utilisée pour trouver les « probabilités des causes ».
Formule de Bayes (version simple)
Soient deux évènements A et B d’un espace probabilisé (
, A
, P), avec P(B)
0.
Alors :
.
Le terme est la définition de la probabilité conditionnelle, et la formule de Bayes
est son expression avec l’autre probabilité conditionnelle. De façon générale, il s’agit
d’exprimer l’une quelconque des deux probabilités conditionnelles en fonction de l’autre.
Formule de Bayes (version composée)
Soient une partition (H
j
) (ou système complet d’événements) d’un espace
et un
évènement B, avec P(B)
0. Alors :
.
Les évènements H
j
peuvent être considérés comme des causes, et l’évènement B comme un
résultat. Il s’agit bien entendu d’une interprétation dans le contexte d’une modélisation, tous
les évènements, causes et résultat, étant de même « nature » mathématique.
Exemple 1
Un dépistage systématique est effectué sur une population dont 6 % des
individus présentent une certaine affection A non apparente. Ce dépistage est débuté par un
test qui donne 95 % de résultats positifs pour les personnes atteintes par A (les autres étant
des « faux négatifs ») et 1 % de résultats positifs pour les personnes non atteintes (les « faux
positifs »).
Quelle est la probabilité conditionnelle qu’une personne prise au hasard soit atteinte par A
sachant que le test a donné un résultat positif ? Soit indemne sachant que le test a donné un
résultat négatif ?
On peut représenter la situation soit par un arbre, soit par un tableau à 4 cases : par exemple,
dans cette deuxième représentation (S signifie sain, et A porteur de l’affection A), la
probabilité de la case « S et test – » est calculée comme le produit P(S)P(test –|S) = 0,94
×
0,99
= 0,9306 ; le tableau est figuré ci-dessous :
test – test +
S 0,9306 0,0094 0,94
A 0,0030 0,0570 0,06
0,9336 0,0664 1
PAB()
PA B()
PB()
------------------------ PA()PBA()
PB()
--------------------------------==
PA B()
PB()
------------------------
PH
jB()
PH
jB()
PB()
------------------------- PH
j
()PBH
j
()
PH
1
()PBH
1
()PH
2
()PBH
2
()PH
k
()PBH
k
()+++
----------------------------------------------------------------------------------------------------------------------------------------==
3 Dress_B Page 16 Samedi, 28. août 2004 11:21 11
Benford (loi de) 17
© Dunod – La photocopie non autorisée est un délit.
ABCDE FGH I J K LMNOPQR STUVWXY Z
Ce tableau est complété par les probabilités « marginales », et on peut calculer notamment
P(test –) = P(S et test –) + P(A et test –) = 0,9336 (somme par colonne) et de même P(test +)
= 0,0664. On peut alors calculer les probabilités conditionnelles demandées :
,
valeur à comparer avec la probabilité a priori 0,06 d’être porteur de A, et :
,
valeur à comparer avec la probabilité a priori 0,94 d’être sain.
Exemple 2 On considère une usine où trois machines fabriquent un même modèle de pièce.
40 % des pièces sont fabriquées par la machine A, qui produit 0,1 % de pièces défectueuses ;
30 % des pièces sont fabriquées par la machine B, plus ancienne, qui produit 0,3 % de pièces
défectueuses ; 30 % des pièces sont fabriquées par la machine C, encore plus ancienne, qui
produit 0,8 % de pièces défectueuses. On demande la probabilité conditionnelle qu’une pièce
ait été fabriquée par la machine C, sachant qu’elle est défectueuse.
Appelons A l’évènement « une pièce prise au hasard a été fabriquée par la machine A », B et
C les évènements analogues pour les machines B et C. Appelons D l’évènement « une pièce
prise au hasard est défectueuse ». Il faut commencer par traduire les pourcentages en proba-
bilités et en probabilités conditionnelles :
P(A) = 0,4, P(B) = 0,3, P(C) = 0,3,
P(D|A) = 0,001, P(D| B) = 0,003, P(D|C) = 0,008.
On peut alors calculer le dénominateur de la formule de Bayes
P(D) = P(A)P(D| A) + P(B)P(D| B) + P(C)P(D| C)
= 0,4 × 0,001 + 0,3 × 0,003 + 0,3 × 0,008 = 0,0037.
Et on a enfin :
On voit ainsi que, pour employer un vocabulaire ancien, la probabilité a priori qu’une pièce
(prise au hasard) ait été fabriquée par C est 0,30, et que la probabilité a posteriori qu’elle ait
été fabriquée par C sachant qu’elle est défectueuse passe à 0,65.
Voir conditionnelle (probabilité).
Benford (loi de) (Benford distribution)
Loi empirique qui régit la distribution du premier chiffre des nombres pris dans des ensem-
bles de données présentant des grandes variations d’échelle. Cette loi a été découverte en
1881 par l’astronome S. Newcomb et redécouverte en 1938 par le physicien F. Benford. Elle
énonce que la probabilité d’apparition du premier chiffre significatif k d’un nombre (écrit en
base 10) est :
P(k) =
En particulier P(1) = 0,301 30 %. L’une des justifications mathématiques de cette loi est
son invariance par un changement arbitraire d’unité de mesure.
Utilisation
Cette loi a été utilisée dans les années 1990 pour détecter des fraudes comptables par utilisa-
tion de données inventées.
PAtest +()
PA et test +()
Ptest +()
--------------------------------- 0,0570
00664,
------------------0,86==
PStest –()
PS et test +()
Ptest –()
-------------------------------- 0,9306
0,9336
---------------- 0,997==
PCD()
PC()PDC()
PD()
--------------------------------0,0024
0,0037
---------------- 0,65===
log10 11
k
---+


3 Dress_B Page 17 Samedi, 28. août 2004 11:21 11
1 / 3 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !