INTRODUCTION A LA STATISTIQUE BAYÉSIENNE NON PARAMÉTRIQUE
Jean-Pierre Florens
Université Toulouse 1 (IDEI, GREMAQ)
Manufacture des Tabacs – Bât F
21, allée de Brienne – 31000 Toulouse
Résumé
L’objectif principal de cet exposé est de rappeler le modèle de base de la statistique bayésienne non
paramétrique constitué d’un échantillonnage i.i.d. et d’une probabilité a priori sur sa distribution
appartenant à la classe des processus de Dirichlet. Cette lois de probabilité a priori est « naturelle
conjuguée » à l’échantillonnage i.i.d. On s’intéressera aux propriétés de représentation des
processus de Dirichlet qui permettent d’analyser par simulation la distribution a priori et a
posteriori de fonctionnelles de la loi de probabilité inconnue. L’application la plus pertinente
consiste à étudier par simulation la distribution de paramètres caractérisés par une équation de
moment.
Le processus de Dirichlet n’engendre que des lois de probabilité discrètes. Cette caractéristique,
intimement associée à sa nature « naturelle conjuguée », rend évidemment impossible l’estimation
de fonctionnelles définies à partir de lois lisses. On évoquera les extensions du processus de
Dirichlet permettant de traiter ce problème.
Abstract
This lecture presents the basic nonparametric bayesian model constructed by an i.i.d. sampling
process and a Dirichlet prior process. This prior is a natural conjugate prior distribution. We focus
our presentation on representations of Dirichlet processes. An analysis by simulation of functional
transformations of prior and posterior Dirichlet processes follows from the representations. An
important application is given by inference of a parameter characterized by a moment equation.
Dirichlet processes only generate discrete probability measures and functional transformations
defined for smouth probabilities only are then undefined. We consider at the end of the presentation
some extensions of Dirichlet processes which cover some of these cases.
1. Introduction
L’objectif de cet exposé est de présenter brièvement les principales caractéristiques du modèle
bayésien non paramétrique élémentaire et d’envisager quelques uns de ses prolongements. Par
modèle élémentaire nous entendons un échantillonnage i.i.d. d’une distribution inconnue munie
d’une probabilité a priori de la famille des processus de Dirichlet. On montre alors que la probabilité
a posteriori de cette distribution est encore un processus de Dirichlet. Les processus de Dirichlet sont
des mesures aléatoires engendrant presque sûrement des probabilités discrètes a support au plus
dénombrable et l’on rappellera la caractérisation des trajectoires engendrées par ces processus ainsi
qu’une technique simple de simulation de processus de Dirichlet approchés. Ce mode de simulation
donne une interprétation bayésienne au bootstrap et permet d’analyser la distribution de certaines
fonctionnelles associées à la distribution inconnue. On donnera ainsi une version bayésienne de la
méthode des moments généralisée.