corrige : ajustement a une loi normale

publicité
M1
CORRIGE : AJUSTEMENT A UNE LOI NORMALE
Mars 2009
Test du Khi deux
Les calculs sont dans le Fichier Exel : Ajustement
I
PRINCIPE DU TEST DU KHI DEUX
Il s'agit ici de véri er, à partir d'un échantillon, si une variable obéit à une loi théorique proposée, ici la loi normale. On formule
donc deux hypothèses statistiques :
H0 : les rentabilités obéissent à une loi normale
H1 : les rentabilités n'obéissent pas à une loi normale
On utilise le test du Khi deux pour dé nir une règle de décision : accepter H0 ou rejeter H0 et accepter l'hypothèse alternative H1:
On garde à l'esprit que notre jugement se fait à partir d'un échantillon et qu'il est impossible d'en déduire une certitude sur notre variable
R; la rentabilité.
Si la distribution est normale, c'est-à dire si H0 est vraie, il se peut qu'on la rejette à tort, trompé par notre échantillon. On xe à la
probabilité que cette situation se produise une valeur maximale, en général 5%: On pose = 0:05; c'est le risque consenti d'erreur. Ce
seuil de 5%, appelé seuil de signi cation, permet de délimiter les zones de rejet et de non rejet de H0 :
Le principe : il s'agit de comparer les effectifs observés, notés Oi dans l'échantillon (les données) avec les effectifs théoriques
attendus sous l'hypothèse d'une loi normale ; nous devrons calculer ces effectifs théoriques que nous noterons Ci :
On dé nit le "Khi deux calculé" par :
X (O C )2
i
i
2
calc =
Ci
Cette variable aléatoire (ses valeurs dépendent de l'échantillon) suit approximativement (pour n 30) une loi du Khi deux, dont nous
devrons préciser le degré de liberté, noté ; on va ainsi déterminer si l'écart entre les effectifs observés et les effectifs théoriques est
signi catif, c'est à dire suf samment grand pour que l'on prenne le risque de rejeter l'hypothèse H0 ; d'une distribution normale.
On déterminera à l'aide d'une table ou de l'ordinateur la valeur du khi deux critique, noté 2 ; , pour le seuil de con ance et le
degré de liberté ; la règle de décision devra être énoncée clairement ;
Si
Si
2
calc
2
calc
2
>
2
;
;
on ne rejettera pas H0
on rejette H0 et on accepte l'hypothèse H1:
page 1
UFR14
2
CORRIGE : AJUSTEMENT A UNE LOI NORMALE
II REALISATION DU TEST
1. Première étape : Formuler les hypothèses statistiques H0 et H1 :
H0 : les rentabilités obéissent à une loi normale.
H1 : les rentabilités n'obéissent pas à une loi normale.
2. Deuxième étape : Indiquer le seuil de signi cation
On xe en général ce seuil à 5%: On pose = 0:05:
3. Calcul des effectifs théoriques et de 2calc :
a. Estimation des paramètres
L'hypothèse H0 ne spéci e pas les paramètres de la loi normale, il faut donc les estimer à partir de notre échantillon.
Rappel : la moyenne de l'échantillon constitue un estimateur sans biais de la moyenne de la population, nous prendrons
donc comme estimation de m; l'espérance de la loi normale, la moyenne de l'échantillon, 0; 0315 ; par contre la variance
de l'échantillon est un estimateur biaisé de la variance de la population et un estimateur sans biais de la variance est S 2 =
P
P
2
2
ni X i X
ni X i X
n
=
Vn , où Vn =
est la variance de l'échantillon ; on estime alors l'écart-type de
n 1
n 1s
n
P
2
r
ni X i X
n
la population par : n 1 =
=
n où n est l'écart-type de l'échantillon. Dans notre exemple,
n
1
n
1
r
254
1:346 = 1:3487 ' 1:35; ce qui ne change rien car l'échantillon est assez grand.
n ' 1:346 et n 1 =
253
b. Effectifs calculés
On va calculer la probabilité de chacun des intervalles sous l'hypothèse H0 ; on a par exemple : p1 = P (R
R m
; Z suivant la loi normale centrée réduite).
(ce calcul de probabilité a été effectué en posant Z =
2; 4) ' 0:0354
Si R suit la loi normale N (0:0315; 1:35), on s'attend à avoir une rentabilité inférieure à 2:4%; dans 3:54% des cas soit avec
un effectif calculé C1 = np1 = 254 0:0354 = 8:99; alors que l'effectif observé correspondant est O1 = 16 ; on calcule les Ci ;
Ci
= pi soit Ci = npi :
en identi ant les fréquences relatives et les probabilités pi ; donc en posant :
n
c. Khi deux calculé :
2
calc
On calcule la somme :
2
calc
=
X (O
i
Ci )2
;
Ci
ce qui donne ici :
2
calc
4. Degré de liberté
Le nombre de degrés de liberté de la loi du Khi deux intervenant ici est :
qui donne ici : = 14 1 2 = 11:
' 15:77
=k
1
r; r étant le nombre de paramètres estimés, ce
5. Règle de décision
On détermine le Khi deux de la table : 2 ; = 20:05;11 ' 19:68 soit avec une table...soit dans Excel avec la fonction KHIDEUX.INVERSE
; la règle de décision est donnée par :
Si 2calc 19:68 on ne rejettera pas H0
Si 2calc > 19:68 on rejette H0 et on accepte l'hypothèse H1:
6. Conclusion
2
2
2
2
0:05;11 , on ne rejette pas l'hypothèse nulle H0 ; au seuil de 5%, la différence
calc ' 15:77 et 0:05;11 ' 19:68; donc calc
entre les effectifs observés et les effectifs calculés n'est pas signi cative et est probablement due au hasard de l'échantillonnage. Il
est donc probable que la distribution des rentabilités obéisse à une loi normale.
2
UFR14
Téléchargement