qu’on écrit plus traditionellement sous la forme
(11) χ2
n(p, ¯pn) =
k
X
i=1
(Ni−ei)2
ei
,
où ei=npi=E(Ni)est la valeur "espérée" de Ni.
Remarque : La loi exacte de χ2
n(p, ¯pn)n’est pas connue mais d’après le résultat du Théo-
rème 2.4, si n est grand, on peut considérer que χ2
n(p, ¯pn)suit la loi χ2(k−1).
Observation fondamentale : La convergence en loi de χ2
n(p, ¯pn)vers χ2(k−1) est très
sensible au fait que ¯pnest la loi empirique de p. En effet supposons qu’on se soit trompé et
que ¯pnsoit en réalité la loi empirique d’une loi q6=p. Alors d’après la loi forte des grands
nombres, Ni
n→qip.s. et donc
(12) 1
nχ2
n(p, ¯pn) = χ2(p, ¯pn) =
k
X
i=1
(pi−Ni/n)2
pi→χ2(p, q)>0p.s.
Il en résulte que χ2
n(p, ¯pn)→+∞p.s. Ainsi si nest grand, les valeurs observées de
χ2
n(p, ¯pn)seront très grandes. Cette observation est à la base du test suivant :
LA PROCÉDURE DU TEST DU CHI-2 : A partir d’un n-échantillon d’une loi discrète
sur l’ensemble {1, . . . , k}, on veut tester l’hypothèse
H0="la loi de l’échantillon est égale à p"
contre l’hypothèse alternative H1="la loi de l’échantillon est différente de p". Compte tenu
de ce qui précède, on forme la quantité χ2
n(p, ¯pn)(11) à partir des valeurs observées Niet
des valeurs espérées eirésultant de l’hypothèse H0. Suivant l’idée expliquée ci-dessus (c’est
à dire que si la valeur observée de χ2
n(p, ¯pn)est trop grande, l’hypothèse H0est peu
crédible mais il faut préciser ce qu’on entend par là. Le plus simple est de pouvoir définir
une borne au delà de laquelle on rejettera H0. Pour cela on procède de la manière suivante :
1) On choisit un risque (de première espèce) α.
2) Avec la table de la loi du χ2(k−1), on détermine la borne bα:= χ2
k−1,α de la queue d’ordre
αde la loi de la variable Xdu χ2(k−1) (i.e. P(X > bα) = α).
3) on rejette l’hypothèse H0au profit de H1si :
(13) χ2
n(p, ¯pn)> bα.
Justification du test : Sous l’hypothèse H0, et si nest assez grand, on sait d’après le
Théorème 2.4 que la variable aléatoire χ2
n(p, ¯pn)suit la loi χ2(k−1), donc
PH0(rejeterH0) = PH0χ2
n(p, ¯pn)> χ2
k−1,α≈α,
ce qui montre que le test est justifié.
Remarque : Le test du χ2est seulement un test asymptotique et il faut que n soit as-
sez grand. Disons seulement qu’il vaut mieux éviter d’utiliser le test du χ2si la taille de
l’échantillon est inférieure à 50.
4