MA401 : Probabilit´es
R´epartitions th´eoriques
En admettant comme plausible une distribution th´eorique particuli`ere, on peut construire une r´epartition id´eale des ob-
servations de l’´echantillon de taille Nen ayant recours aux probabilit´es tabul´ees (ou calcul´ees) du mod`ele th´eorique : p1,
p2, . . . , pk. On obtient alors les effectifs th´eoriques nt,i en ´ecrivant nt,i =N pi. On dispose automatiquement de la relation
k
X
i=1
nt,i =N.
D´efinition de l’´ecart entre les deux distributions
Pour ´evaluer l’´ecart entre les effectifs observ´es niet les effectifs th´eoriques nt,i, on utilise la somme des ´ecarts normalis´es
entre les deux distributions, `a savoir
χ2=(n1−nt,1)2
nt,1
+(n2−nt,2)2
nt,2
+··· +(nk−nt,k)2
nt,k
.
Plus le nombre χ2ainsi calcul´e est grand, plus la distribution ´etudi´ee diff´erer de la distribution th´eorique.
Quelques consid´erations th´eoriques `a propos de cet ´ecart
Le nombre d’observations niparmi l’´echantillon de taille Nsusceptible d’appartenir `a la classe iest la r´ealisation d’une
variable binomiale Nide param`etres Net pi(chacune des Nobservations appartient ou n’appartient pas `a la classe iavec une
probabilit´e pi). Si Nest suffisamment grand (on se place dans le cas d’´echantillons de taille 50 minimum) et pipas trop petit
(on a effectu´e des regroupements de classes pour qu’il en soit ainsi), on peut approcher la loi binomiale par la loi normale,
c’est-`a-dire B(N, pi) par N(Npi,pNpi(1 −pi)). Pour simplifier, on approxime Npi(1 −pi) par Npi. Donc Ni−N pi
Npisuit la loi
N(0,1). Lorsqu’on ´el`eve au carr´e toutes ces quantit´es et qu’on en fait la somme, on obtient une somme de klois normales
centr´ees r´eduites (presque) ind´ependantes.
Mais quel est le nombre de degr´es de libert´e de cette variable du khi-deux ?
Il y a kcarr´es, donc `a priori kdegr´es de libert´e. Mais on perd toujours un degr´e de libert´e car on a fix´e l’effectif total de
l’´echantillon,
k
X
i=1
Ni=N.
On peut perdre d’autres degr´es de libert´e si certains param`etres de la loi th´eorique doivent ˆetre estim´es `a partir de
l’´echantillon.
1. Si la distribution th´eorique est enti`erement sp´ecifi´ee, c’est-`a-dire si on cherche `a d´eterminer si la distribution observ´ee
suit une loi dont les param`etres sont connus avant mˆeme de choisir l’´echantillon, on a k−1 degr´es de libert´e (kcarr´es
ind´ependants moins une relation entre les variables).
2. S’il faut d’abord estimer rparam`etres de la loi `a partir des observations de l’´echantillon (par exemple on cherche si la
distribution est normale mais on ne connaˆıt d’avance ni sa moyenne ni son ´ecart-type), il n’y a plus que k−1−rdegr´es
de libert´e.
Dans le cas g´en´eral, on dira que la loi du khi-deux suivie par l’´ecart entre les deux distributions a k−1−rdegr´es de libert´e
lorsqu’on a estim´e rparam`etres de la loi th´eorique `a partir des observations de l’´echantillon (avec la possibilit´e pour rde
valoir 0).
2.2 Le test d’ajustement de Pearson
Il nous faut maintenant d´ecider, `a l’aide de cet indicateur qu’est le χ2, si les ´ecarts entre les effectifs th´eoriques et ceux qui
r´esultent des observations sont significatifs d’une diff´erence de distribution ou si ils sont dus aux fluctuations d’´echantillonnage.
Nous proc´ederons comme d’habitude en quatre ´etapes.
1`ere ´etape : Formulation des hypoth`eses.
On va donc tester l’hypoth`ese H0(appel´ee hypoth`ese nulle) contre l’hypoth`ese H1(hypoth`ese alternative) :
(H0Les observations suivent la distribution th´eorique sp´ecifi´ee,
H1Les observations ne suivent pas la distribution th´eorique sp´ecifi´ee.
2`eme ´etape : D´etermination de la fonction discriminante du test et de sa distribution de probabilit´e.
On utilise la variable al´eatoire
χ2=(N1−nt,1)2
nt,1
+(N2−nt,2)2
nt,2
+··· +(Nk−nt,k)2
nt,k
.
3`eme ´etape : D´etermination des valeurs critiques de χ2d´elimitant les zones d’acceptation et de rejet.
On impose `a la zone d’acceptation de H0concernant la valeur du χ2d’ˆetre un intervalle dont 0 est la borne inf´erieure (car
un χ2est toujours positif).
L2 Math´ematiques et Informatique 2009-2010 3 FST - Universit´e Paul C´ezanne