Tests du χ2 1 Test d`ajustement `a une loi multinomiale

Master Math´ematiques et Applications
Sp´ecialit´e Statistique Septembre 2015
Fiche 8
Tests du χ2
1 Test d’ajustement `a une loi multinomiale
L’objectif est de tester l’ad´equation d’un ´echantillon (N1,...,Nm) de taille totale n=N1+···+Nm
`a une loi multinomiale M(n;p1,...,pm) o`u les pisont connus. Autrement dit, on veut tester
H0: (N1,...,Nm)∼ M(n;p1,...,pm) vs H1: (N1,...,Nm)M(n;p1,...,pm).
1.1 Principe
Pour ce faire, on construit la statistique de test suivante :
Tn=n
m
X
i=1
Ni
npi2
pi
=
m
X
i=1
(Ninpi)2
npi
,
qui mesure en un certain sens la distance entre effectifs observ´es et effectifs th´eoriques. On peut
montrer que, sous l’hypoth`ese H0,
Tn
L
n→∞ χ2
m1,
tandis que, sous H1,
Tn
p.s.
n→∞ +.
On rejette donc H0si l’observation tnde la statistique de test prend une grande valeur.
1.2 Winter is coming
On a relev´e les dates de naissance d’un ´echantillon de personnes puis regroup´e ces naissances par
saison, ce qui donne le tableau suivant :
Automne Hiver Printemps Et´e
Nombre de naissances 380 435 483 410
On veut tester si les naissances sont uniform´ement r´eparties sur les saisons de l’ann´ee.
1. Visualiser les donn´ees, par exemple via la fonction barplot.
2. Proposer un test de niveau asymptotique 5% permettant de r´epondre `a cette question. Effec-
tuer le test “`a la main”.
3. Tracer la densit´e de la loi du khi-deux qui intervient dans ce test. Superposer `a ce graphe le(s)
quantile(s) d´efinissant l’intervalle d’acceptation de H0, ainsi que l’observation de la statistique
de test.
4. Retrouver le r´esultat du test `a l’aide de la fonction chisq.test.
1
2 Test du χ2d’ind´ependance
Le but est cette fois de tester l’ind´ependance entre deux variables qualitatives. On consid`ere que
les donn´ees sont contenues dans un tableau de contingence (nij )1iI,1jJ.
2.1 Principe
Pour tester l’ind´ependance de deux variables qualitatives, on teste l’hypoth`ese nulle H0: “les deux
variables sont ind´ependantes” contre l’hypoth`ese alternative H1: “les deux variables ne sont pas
ind´ependantes”. Pour cela, on construit la statistique de test suivante :
Tn=
I
X
i=1
J
X
j=1
(nij Nij )2
Nij
,
o`u nij est l’effectif observ´e pour la modalit´e ide la premi`ere variable et la modalit´e jde la seconde,
Nij correspond `a l’effectif sous l’hypoth`ese d’ind´ependance, Iet J´etant les nombres de modalit´es
de chacune des variables. Ainsi, nrepr´esentant l’effectif total, nous avons
Nij =nˆpiˆpjavec ˆpi=Pjnij
net ˆpj=Pinij
n.
On peut montrer que, sous l’hypoth`ese H0,
Tn
L
n→∞ χ2
(I1)×(J1),
tandis que, sous H1,
Tn
p.s.
n→∞ +.
On rejette donc H0si l’observation tnde la statistique de test prend une grande valeur.
2.2 Not even God could sink this ship
Le Titanic a emport´e `a son bord 325 passagers en premi`ere classe, 285 en deuxi`eme classe, 706
passagers en troisi`eme classe et 885 membres d’´equipage. Parmi les survivants, on comptait 203
passagers en premi`ere classe, 118 en deuxi`eme classe, 178 en troisi`eme classe et 212 membres
d’´equipage. Y a-t-il un lien entre le fait d’avoir surv´ecu et la classe ?
1. Cr´eer sur Rla matrice :
C1 C2 C3 E
survie 203 118 178 212
mort 122 167 528 673
2. Donner les diff´erentes ´etapes du test permettant de r´epondre `a cette question. Effectuer le
test “`a la main”.
3. Effectuer le test en question `a l’aide de la fonction chisq.test.
4. Retrouver “`a la main” la p-value donn´ee en sortie du test.
2
1 / 2 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !