476 STATISTIQUE EN ACTION
On estime alors
f
par
b
fn
sur le
n
–échantillon initial, puis, en utilisant une méthode de
simulation de variables aléatoires mettant en jeu la densité (la plus connue est la méthode de
rejet, voir le paragraphe 9.3), on obtient de nouvelles variables aléatoires, qui, conditionnelle-
ment à
X1,...,Xn
, sont indépendantes et identiquement distribuées selon la loi de densité
b
fn
.
Par cette méthode, on a un contrôle asymptotique de l’écart de la distribution des nouvelles
observations à celle de l’échantillon initial et par conséquent, pour peu que par exemple la
fonction à intégrer soit bornée, de l’écart des intégrales sous
µ
et sous ses estimées. Cet écart
est en effet quantifié par des distances en variation totale.
Notons que la méthode qui aurait consisté à estimer la fonction de répartition (par la fonc-
tion de répartition empirique) pour simuler les nouvelles variables par méthode d’inversion
(voir chapitre 9) aurait été décevante, puisqu’elle consiste à simplement tirer au hasard et avec
remise les
Xn+1,...,Xm
parmi les
X1,...,Xn
. On retrouve le fait que la mesure empirique
est concentrée en un nombre fini de points. En particulier, dans cette méthode naïve, les
queues de distribution posent problème. La loi associée à la fonction de répartition empirique
canonique a en effet un support borné, alors que ce n’est pas nécessairement le cas de la loi
bµn
donnée par un bon estimateur de la densité
b
fn
, surtout si l’on a une idée a priori de la forme
ou du poids de la queue et qu’on l’exploite. C’est le cas notamment si l’on est dans un cadre
d’estimation paramétrique et que l’on connaît la forme de f.
Illustrations informatiques de convergence en loi
Dans les illustrations informatiques, on représente souvent la convergence en loi par une
convergence de densités. Typiquement, si on établit, par exemple, qu’une suite d’estimateurs
converge en loi,
X(n) N(0,1)
pour fixer les idées, alors, pour illustrer cette convergence,
on va fixer une grande valeur de
n
et simuler un
Nn
–échantillon distribué selon la loi de
X(n)
,
noté
X(n)
1, . . . , X(n)
Nn;
après quoi, on établira l’histogramme des valeurs du
Nn
–échantillon et on essaiera de se
convaincre qu’il a une forme proche d’une courbe en cloche, qui est précisément la forme
de la densité de la loi normale standard. C’est ce que nous avons réalisé par exemple dans les
simulation des chapitres 19 et 23.
Mais ces histogrammes, nous l’avons vu, sont en fait des estimateurs de la densité de la
loi de
X(n)
lorsque celle-ci existe et que la taille des classes est bien choisie en fonction de
Nn
.
On essaie donc de représenter une convergence en loi par une proximité de densités. Or, a
priori, la convergence en loi est équivalente à la convergence des fonctions de répartitions,
c’est-à-dire, à celle des intégrales des densités (lorsque ces dernières existent). Cela ne signifie
généralement pas que les densités elles-mêmes convergent ponctuellement. C’est, en conclusion,
une illustration dangereuse. . .
. . . Sauf qu’elle est beaucoup plus agréable et plus parlante visuellement qu’une convergence
de fonctions de répartitions : plus parlante parce que les différences d’aires entre la densité
(estimée sur le
Nn
–échantillon) au rang
n
et la densité de la loi limite forment exactement
http://www.dma.ens.fr/statenaction