STATISTIQUES IUT DEUXIEME PARTIE

publicité
58
IV TESTS D’ADEQUATION
1. Comparaison d’une distribution expérimentale à une loi de probabilité
a) But du test
On cherche à montrer qu’un ensemble d’observations est distribué suivant une certaine loi statistique.
Ce test ne fait pas double emploi avec le test précédent et il n’implique pas le caractère aléatoire des
observations. Les observations peuvent très bien être classées par ordre croissant et les effectifs être
distribués suivant une certaine loi statistique.
b) Choix de la loi statistique
On choisit la loi statistique suivant le caractère continu ou discontinu des mesures et suivant la forme
du diagramme en bâtons ou de l’histogramme expérimental.
On calcule également la variance et la moyenne expérimentales.
Si m est voisin de s² et si le caractère est discret, la distribution peut être bien représentée par une loi
de Poisson.
Pour une loi Normale ou Log Normale, on construit un histogramme et on se base sur l’allure de cet
histogramme. On calcule évidemment aussi la moyenne et la variance expérimentales.
c) Ajustement de la loi statistique à la distribution expérimentale (variable discrète)
Pour les variables discrètes on compare pour chaque valeur de la variable les grandeurs :
ni (effectifs expérimentaux) à n.P(xi) (effectifs théoriques, n est le nombre total de mesures)
En effet la fréquence fi =
ni
→ P(xi) d’après le théorème de Bernouilli, mais le test du χ² exige qu’on
n
convertisse les fréquences en effectifs.
On peut regrouper plusieurs valeurs consécutives de xi en classes, dans ce cas on opère sur
l’effectif total des classes appelé nj c’est-à-dire :
n j=
∑ ni
classe
Pierre Jost
cette valeur est comparée à n ×
∑ P(x i )
classe
Statistiques à l’usage des ingénieurs et des techniciens
59
Fig. 27
Ajustement d’une loi et d’une distribution discontinues
d) Ajustement de la loi statistique à la distribution expérimentale (variable continue)
Pour des variables continues le problème est plus complexe parce qu’il faut comparer l’effectif d’une
classe à une probabilité. Comme la loi statistique est une fonction de densité de probabilité il faut
intégrer celle-ci aux bornes des classes de l’histogramme.
Fig. 28
Ajustement d’une loi continue et d’un histogramme
Il faut donc comparer pour chaque classe l’effectif ni de la classe à l’intégrale
n × P ( x < X < x+ ∆x ) = n ×
x+∆x
∫
g(X)dX = n × (G ( x+∆x ) − G(x))
x
évidemment n =
∑ n i et x, x + ∆x sont les bornes des classes, g(X) est la loi de probabilité testée
et G(X) sa fonction de répartition.
Pierre Jost
Statistiques à l’usage des ingénieurs et des techniciens
60
Les effectifs théoriques sont calculés à l’aide d’une des trois relations:
ni est comparé à




ou


ou

n( G( x + ∆x) − G(x))
n
( g( x + ∆x) + g(x)) ∆x
2
1 

n g x + ∆x ∆x

2 
e) Test proprement dit
Lorsqu’on a choisi une loi statistique, effectué le regroupement des valeurs expérimentales en classes
et calculé correctement les effectifs théoriques on passe au calcul du χ².
Soit k le nombre de classes (ou de valeurs individuelles).
k
( n i − np i ) 2
i =1
np i
χ =∑
2
k
n 2
=∑ i −n
np i
i =1
(36)
npi représente les effectifs théoriques donc, soit np(xi) soit une des relations ci-dessus.
La grandeur χ² suit une loi du Khi-deux à ν degrés de liberté avec
ν = k −1− r
k : le nombre de classes
1 pour le calcul de n
r : nombre de paramètres pour le calcul des effectifs théoriques.
r = 1 (loi de Poisson) r = 2 (loi binomiale et loi Normale)
f)
Conditions d’application et interprétation du test
Pour chaque classe il faut que : npi ≥ 5 et ni ≥ 4 parce que le terme npi apparaît au dénominateur et
une valeur trop faible fausse le calcul du χ².
Si cette condition n’est pas réalisée il faut augmenter la largeur des classes.
Pour un bon ajustement le nombre de classes doit être > 5.
Une valeur faible du χ 2
c indique que la loi choisie convient (χ² = 0 si tous les ni = npi).
On cherche dans la table du χ² la valeur critique χ²c correspondant à P = 1 - α, si α est le seuil de
risque du test.
Pierre Jost
Statistiques à l’usage des ingénieurs et des techniciens
61
Si χ² < χ²c la loi est non significativement différente de la loi testée.
Cela ne signifie pas que la loi testée est la seule qui conviendrait. D’autres lois, bien que conduisant à
un χ² plus élevé peuvent être non rejetées.
2. Test de Normalité de Shapiro-Wilk
a) Intérêt des tests de normalité
La plupart des tests (Fisher, Student, …) ne s'appliquent que lorsque les populations se distribuent
suivant une loi Normale. Il est donc important de pouvoir prouver cette propriété en faisant le moins
possible d'essais.
Le test de Khi-deux est utilisable, mais il nécessite un très grand nombre de mesures (plusieurs
dizaines ou centaines).
b) Test proprement dit
Ce test est beaucoup utilisé parce qu'il est assez puissant et nécessite peu de mesures (une dizaine).
Son principe est basé sur les probabilités associées aux écarts interfractiles. (On teste si les
différences xi – xj sont compatibles avec les probabilités des écarts interfractiles)
Les mesures sont classées par ordre croissant :
x1 ≤ x2 ≤ … ≤ xj ≤ … ≤ xn
On calcule :
d1 = xn – x1 , d2 = xn-1 – x2 , …
dj = xn - j+1 – xj avec j = 1, 2 …
n −1
n
ou
suivant que n est pair ou impair
2
2
ensuite la somme
[∑ a d ]
2
W=
∑ (xi
j
j
− m)
2
(37)
Les poids aj sont calculés en fonction des fractiles de la loi de Gauss (plus la probabilité est faible,
plus on donne un poids élevé à l'intervalle interfractile) et sont tabulés en fonction de n et de j.
L’hypothèse de Normalité est acceptée lorsque W est compris dans l’intervalle des valeurs critiques
[W(α/2),W(1-α/2)].
Si W.> W(1-α/2), La distribution est trop aplatie (existence de nombreuses valeurs éloignées de la
moyenne ce qui entraîne une valeur élevée de W), par contre si W.< W(α/2) il y a trop de valeurs
proches de la moyenne (le numérateur de W est alors trop faible).
Pierre Jost
Statistiques à l’usage des ingénieurs et des techniciens
62
TESTS D’HYPOTHESES
CE QU’IL FAUT ABSOLUMENT RETENIR
Pratique des tests statistiques.
Signification des risques de première et de deuxième espèce.
Lien entre les risques et leur variation en fonction du nombre de mesures.
Connaître tous les tests d’égalité des moyennes et des variances.
Savoir retrouver facilement les tests d’ajustement.
Savoir lire les tables statistiques
Pierre Jost
Statistiques à l’usage des ingénieurs et des techniciens
Téléchargement