UFR Sciences et Techniques Année 2007-2008 Master 1 de Mathématiques Statistiques Feuille de TD no 2 Le test du chi-deux Exercice 1 (loi multinomiale) On dispose de n boîtes numérotées de 1 à n dans lesquelles on veut répartir des boules de k couleurs différentes. Pour chaque couleur j = 1, . . . , k, on dispose d’un nombre de boules supérieur à n. On ne peut mettre qu’une boule par boîte. Une «répartition» est une manière de remplir les boîtes ; autrement dit une «répartition» est entièrement déterminée par la couleur figurant dans chaque boîte. Mathématiquement une «répartition» est donc une application f de l’ensemble B = {b1 , . . . , bn } des n boîtes dans l’ensemble C = {1, . . . , k} des k couleurs. 1) Vérifier qu’il y a k n répartitions possibles. 2) On suppose qu’il y a k = 2 couleurs et soient n1 et n2 des entiers fixés tels que n1 +n2 = n. Montrer que le nombre de répartitions avec n1 boules de la couleur 1 et n2 boules de la cou. leur 2 est égal à n1n! !n2 ! 3) Si k est quelconque et si n1 , . . . , nk sont des entiers fixés tels que n1 +· · ·+nk = n, montrer que le nombre de répartitions avec nj boules de la couleur j (j = 1, . . . , k) est égal à n! . n1 ! . . . nk ! 4) Soit (X1 , . . . , Xn ) un n-échantillon d’une loi discrète p = (p1 , . . . , pk ) concentrée sur les entiers 1, 2, . . . , k et N = (N1 , . . . , Nk ) le vecteur aléatoire tel que Nj = n X 1[Xi =j] (nombre d’apparitions de la valeur j dans l’échantillon) i=1 a) Démontrer que Nj est une variable aléatoire binomiale B(n, pj ). b) Démontrer que la loi du vecteur aléatoire N (loi multinomiale de paramètre n et p) est donnée par n! P(N1 = n1 , . . . , Nk = nk ) = pn1 1 . . . pnk k , n1 ! . . . nk ! où n1 , . . . , nk sont des entiers tels que n1 + · · · + nk = n. Exercice 2 (tester si une pièce est équilibrée) On peut, bien qu’il y ait des méthodes plus efficaces, utiliser le test du chi-deux pour tester si une pièce est truquée. Par exemple : On a lancé 200 fois une pièce de monnaie et observé 115 faces et 85 piles. Utiliser le test du chi-deux pour rejeter ou non l’hypothèse que la pièce est équilibrée, au niveau de confiance 1 − α = 0, 95 puis au niveau de confiance 0, 99. Exercice 3 (tester si des dés sont truqués) Dans la même esprit que l’exercice précédent, on peut en observant seulement certains événements tester si un jeu est est régulier ou non. Par exemple : Un jeu consiste à lancer une paire de dés (supposés non truqués). Un joueur qui avait parié sur le «sept» et le «onze», a observé que sur 360 lancers, on a eu 74 fois «sept» et 24 fois «onze». Au niveau de confiance 0, 95, peut-on accepter l’hypothèse que les dés ne sont pas truqués ? Exercice 4 (tester un générateur de nombres au hasard) Un générateur de nombres au hasard entre 0 et 9 a fourni 250 nombres et on observé les résultats suivants. Etudier si au risque α = 0, 05 puis 0, 01, on peut accepter l’hypothèse que le générateur est correct : nombre fréquence 0 17 1 31 2 29 3 18 4 14 5 20 6 35 7 30 8 20 9 36 Exercice 5 (convergence vers la loi de Poisson) Le test du chi-deux est basé sur le fait que pour tout i = 1, . . . , k la variable aléatoire Ni −npi √ ≈ N (0, 1 − pi ) (voir le cours). Pour cela il convient que le produit npi ne soit pas trop npi petit. Les statisticiens conviennent qu’il faut que npi ≥ 10 sinon les résultats ne sont pas e = (N1 , . . . , Nk−1 ) bons. Considérons le vecteur constitué des k − 1 premières composantes N du vecteur Pk−1 multinomial N (noter que la dernière composante est liée aux autres car Nk = n − i=1 Ni ). On suppose que n → +∞ et que npi = λi reste constant et égal à λi > 0. Démontrer que le vecteur aléatoire (N1 , . . . , Nk−1 ) converge en loi vers un vecteur limite (X1 , . . . , Xk−1 ) où les Xi sont des variables aléatoires indépendantes de Poisson de paramètres respectifs λ1 , . . . , λk−1 . e est de la forme (indication : on montrera que la fonction caractéristique du vecteur N n ϕNe (t1 , . . . , tk−1 ) = 1 + p1 (eit1 − 1) + · · · + pk−1 (eitk−1 − 1) , e comme somme pour cela on reviendra à la définition de Nj (Exercice 1, 4)) et on écrira N λi de n vecteurs aléatoires indépendants et de même loi puis on écrira pi = n et on passera à la limite). Remarque : Ce résultat de convergence en loi s’interprête concrètement de la manière suivante : si n est grand et les pi sont très petits de telle sorte que les produits npi = λi e a une loi approximativement soient de taille raisonnable (entre 1 et 9), alors le vecteur N égale à celle d’un vecteur de lois de Poisson indépendantes et de paramètres respectifs λi , c’est à dire nk−1 n1 −λ1 λ1 −λk−1 λk−1 P(N1 = n1 , . . . , Nk−1 = nk−1 ) = e ...e . n1 ! nk−1 !