1 Introduction
Nous consid´erons dans cette note une observation al´eatoire Yprenant ses valeurs dans
Rd. Pr´ecisons d’embl´ee qu’il s’agit d’un objet g´en´erique qui peut, par exemple, prendre
la forme d’un ´echantillon de variables ind´ependantes et identiquement distribu´ees. Plus
g´en´eralement, il peut ´egalement s’agir des premi`eres observations d’une s´erie temporelle,
ou encore d’un objet al´eatoire plus complexe, tel qu’un arbre g´en´ealogique. Le vecteur
al´eatoire Yest suppos´e en outre admettre une densit´e f(y|θ) par rapport `a la mesure
de Lebesgue sur Rd. Ici, θ∈ T ⊂ Rpd´esigne un param`etre inconnu que nous souhaitons
estimer.
Dans le paradigme bay´esien, on raisonne comme si le param`etre ´etait lui-mˆeme une
variable al´eatoire Θ`a valeurs dans T, la densit´e f(y|θ) devenant ainsi la densit´e con-
ditionnelle de Ylorsque Θ=θ. En admettant alors que la loi de Θest elle-mˆeme
absolument continue par rapport `a la mesure de Lebesgue sur Rp, de densit´e π(θ), la
loi conditionnelle de Θsachant Y=yadmet une densit´e g(θ|y), d´efinie P(Θ,Y)-presque
sˆurement et donn´ee par
g(θ|y) = f(y|θ)π(θ)
¯
f(y),
o`u
¯
f(y) = ZT
f(y|θ)π(θ)dθ
d´esigne la densit´e marginale de la variable al´eatoire Y. Dans ce contexte, la densit´e π(θ)
est dite densit´e a priori, tandis que la densit´e g(θ|y) porte le nom de densit´e a posteriori.
Dans la pratique, l’approche bay´esienne peut ˆetre rendue difficile lorsque l’on ne dis-
pose pas d’une expression analytique simple pour la densit´e a posteriori g(θ|y) et/ou les
quantit´es qui lui sont connexes. Dans une telle situation, on a en g´en´eral recours `a des
m´ethodes de simulation num´erique, par exemple les algorithmes de type MCMC (Markov
Chain Monte Carlo, voir par exemple l’ouvrage de Robert, 1996, pour une introduction
au sujet). Pourtant, malgr´e leur puissance et leur flexibilit´e, les algorithmes MCMC se
r´ev`elent inop´erants dans un nombre croissant d’applications impliquant des dimensions
tr`es importantes ou des mod`eles extrˆemement compliqu´es. C’est typiquement le cas en
´ecologie et en g´en´etique des populations. Il faut alors recourir `a de nouvelles strat´egies
de simulation, les plus prometteuses `a ce jour reposant sur les algorithmes dits abc, pour
Approximate Bayesian Computation (Beaumont, Zhang et Balding, 2002 ; Blum, 2010).
Dans cette communication, nous pr´esentons une analyse math´ematique d´etaill´ee d’un
algorithme abc typique, en formalisant en particulier son lien avec des techniques non
param´etriques d’estimation de la densit´e conditionnelle par plus proches voisins. En guise
de lecture pr´eliminaire, nous renvoyons le lecteur `a l’article de synth`ese de Marin, Pudlo,
Robert et Ryder (2011) consacr´e aux proc´edures abc.
2