Probabilit´
es-Statistiques Ann´
ee 2008-2009
Utilisation de la lgn et du tlc en statistique
Dans de nombreux probl`emes concrets interviennent des quantit´es al´eatoires, dont on ne connaˆıt
a priori pas la loi. Une approche possible consiste `a faire l’hypoth`ese que les lois en questions
appartiennent `a des familles de lois connues, d´ependant de param`etres, par exemple : lois de Ber-
noulli B(p), lois exponentielles E(λ), de Poisson P(λ), gaussiennes N(µ, σ2) etc. Ayant fait cette
hypoth`ese, le but de la statistique param´etrique est d’estimer le ou les param`etres de la loi, dans
les exemples ci-dessus : p, λ, (µ, σ2).
1 Loi de grands nombres pour fournir des estimateurs
Supposons que dans une exp´erience concr`ete intervient une quantit´e al´eatoire dont la loi appartient
`a une famille de lois (connue) d´ependant d’un param`etre (inconnu), disons Θ(θ). Une m´ethode
possible pour estimer le param`etre θconsiste `a utiliser la loi des grands nombres.
Exemple 1 : Lors d’un r´ef´erendum avec deux r´eponses possibles (0 ou 1), on fait un sondage `a
la sortie des urnes pour pr´edire le r´esultat final avant que tous les bulletins ne soient d´epouill´es.
`
A cette fin, on demande `a npersonnes pour qui ils ont vot´e lorsqu’ils sortent de l’isoloire ; on
r´ecolte ainsi des donn´ees (x1, . . . , xn)∈ {0,1}n. Soit pla proportion (inconnue) d’´electeurs ayant
vot´e 1 dans la population totale. Un mod`ele naturel pour d´ecrire le vote consiste `a supposer que
les ´electeurs font le choix 0 avec probabilit´e 1 −pet le choix 1 avec probabilit´e p, autrement dit
que les xisont des r´ealisations de variables ind´ependantes Xide loi de Bernoulli B(p). D’apr`es la
loi (faible) des grands nombres, lorsque ntend vers l’infini, on a alors :
bpn:= 1
n
n
X
i=1
Xi
P
−→ E[X1] = p.
Lorsque nest grand, avec une probabilit´e proche de 1, on peut affirmer que bpn≈p. La loi des
grands nombres nous fournit donc un bon candidat pour estimer p.
Exemple 2 : Dans une usine fabriquant des composants ´electriques, on veut s’assurer que des
r´esistances ont une dur´ee de vie suffisament grande pour pouvoir ˆetre commercialis´ees. On pr´el`eve
nr´esistances de la chaˆıne de production et on mesure leur dur´ee de vie dans un circuit test. On
r´ecolte ainsi des donn´ees (x1, . . . , xn)∈Rn
+. La dur´ee de vie des r´esistances peut ˆetre mod´elis´ee par
une variable al´eatoire de loi expontentielle E(λ) o`u λest un param`etre inconnu. Autrement dit, on
peut supposer que les xisont des r´ealisations de variables ind´ependantes Xi, de loi expontentielle
E(λ). D’apr`es la loi des grands nombres, on a alors :
1
n
n
X
i=1
Xi
P
−→ E[X1] = 1
λ.
Un bon candidat pour estimer λest donc b
λn:= n/ Pn
1xi.
D´efinition : On dit qu’un estimateur b
θnd’un param`etre θ, bas´e sur nobservations (x1, . . . , xn),
est consistant si b
θntend en probabilit´e vers θ, lorsque ntend vers l’infini.