UFR Sciences et Techniques Année 2007-2008 Master 1 de

publicité
UFR Sciences et Techniques
Année 2007-2008
Master 1 de Mathématiques
Statistiques
Feuille de TD no 2
Le test du chi-deux
Exercice 1 (loi multinomiale)
On dispose de n boîtes numérotées de 1 à n dans lesquelles on veut répartir des boules de
k couleurs différentes. Pour chaque couleur j = 1, . . . , k, on dispose d’un nombre de boules
supérieur à n. On ne peut mettre qu’une boule par boîte. Une «répartition» est une manière
de remplir les boîtes ; autrement dit une «répartition» est entièrement déterminée par la
couleur figurant dans chaque boîte.
Mathématiquement une «répartition» est donc une application f de l’ensemble B = {b1 , . . . , bn }
des n boîtes dans l’ensemble C = {1, . . . , k} des k couleurs.
1) Vérifier qu’il y a k n répartitions possibles.
2) On suppose qu’il y a k = 2 couleurs et soient n1 et n2 des entiers fixés tels que n1 +n2 = n.
Montrer que le nombre de répartitions avec n1 boules de la couleur 1 et n2 boules de la cou.
leur 2 est égal à n1n!
!n2 !
3) Si k est quelconque et si n1 , . . . , nk sont des entiers fixés tels que n1 +· · ·+nk = n, montrer
que le nombre de répartitions avec nj boules de la couleur j (j = 1, . . . , k) est égal à
n!
.
n1 ! . . . nk !
4) Soit (X1 , . . . , Xn ) un n-échantillon d’une loi discrète p = (p1 , . . . , pk ) concentrée sur les
entiers 1, 2, . . . , k et N = (N1 , . . . , Nk ) le vecteur aléatoire tel que
Nj =
n
X
1[Xi =j]
(nombre d’apparitions de la valeur j dans l’échantillon)
i=1
a) Démontrer que Nj est une variable aléatoire binomiale B(n, pj ).
b) Démontrer que la loi du vecteur aléatoire N (loi multinomiale de paramètre n et p) est
donnée par
n!
P(N1 = n1 , . . . , Nk = nk ) =
pn1 1 . . . pnk k ,
n1 ! . . . nk !
où n1 , . . . , nk sont des entiers tels que n1 + · · · + nk = n.
Exercice 2 (tester si une pièce est équilibrée)
On peut, bien qu’il y ait des méthodes plus efficaces, utiliser le test du chi-deux pour tester
si une pièce est truquée. Par exemple :
On a lancé 200 fois une pièce de monnaie et observé 115 faces et 85 piles. Utiliser le test du
chi-deux pour rejeter ou non l’hypothèse que la pièce est équilibrée, au niveau de confiance
1 − α = 0, 95 puis au niveau de confiance 0, 99.
Exercice 3 (tester si des dés sont truqués)
Dans la même esprit que l’exercice précédent, on peut en observant seulement certains événements tester si un jeu est est régulier ou non. Par exemple :
Un jeu consiste à lancer une paire de dés (supposés non truqués). Un joueur qui avait parié
sur le «sept» et le «onze», a observé que sur 360 lancers, on a eu 74 fois «sept» et 24 fois
«onze». Au niveau de confiance 0, 95, peut-on accepter l’hypothèse que les dés ne sont pas
truqués ?
Exercice 4 (tester un générateur de nombres au hasard)
Un générateur de nombres au hasard entre 0 et 9 a fourni 250 nombres et on observé les
résultats suivants. Etudier si au risque α = 0, 05 puis 0, 01, on peut accepter l’hypothèse que
le générateur est correct :
nombre
fréquence
0
17
1
31
2
29
3
18
4
14
5
20
6
35
7
30
8
20
9
36
Exercice 5 (convergence vers la loi de Poisson)
Le test du chi-deux est basé sur le fait que pour tout i = 1, . . . , k la variable aléatoire
Ni −npi
√
≈ N (0, 1 − pi ) (voir le cours). Pour cela il convient que le produit npi ne soit pas trop
npi
petit. Les statisticiens conviennent qu’il faut que npi ≥ 10 sinon les résultats ne sont pas
e = (N1 , . . . , Nk−1 )
bons. Considérons le vecteur constitué des k − 1 premières composantes N
du vecteur
Pk−1 multinomial N (noter que la dernière composante est liée aux autres car Nk =
n − i=1 Ni ).
On suppose que n → +∞ et que npi = λi reste constant et égal à λi > 0. Démontrer
que le vecteur aléatoire (N1 , . . . , Nk−1 ) converge en loi vers un vecteur limite (X1 , . . . , Xk−1 )
où les Xi sont des variables aléatoires indépendantes de Poisson de paramètres respectifs
λ1 , . . . , λk−1 .
e est de la forme
(indication : on montrera que la fonction caractéristique du vecteur N
n
ϕNe (t1 , . . . , tk−1 ) = 1 + p1 (eit1 − 1) + · · · + pk−1 (eitk−1 − 1) ,
e comme somme
pour cela on reviendra à la définition de Nj (Exercice 1, 4)) et on écrira N
λi
de n vecteurs aléatoires indépendants et de même loi puis on écrira pi = n et on passera à
la limite).
Remarque : Ce résultat de convergence en loi s’interprête concrètement de la manière
suivante : si n est grand et les pi sont très petits de telle sorte que les produits npi = λi
e a une loi approximativement
soient de taille raisonnable (entre 1 et 9), alors le vecteur N
égale à celle d’un vecteur de lois de Poisson indépendantes et de paramètres respectifs λi ,
c’est à dire
nk−1
n1
−λ1 λ1
−λk−1 λk−1
P(N1 = n1 , . . . , Nk−1 = nk−1 ) = e
...e
.
n1 !
nk−1 !
Téléchargement