Cours 9 — 1er décembre 2010/2011
9.2 Méthodes Bayésiennes
9.2.1 Introduction
Vocabulaire :
– a priori : p(θ)
– vraisemblance : p(x|θ)
– vraisemblance marginale : ´p(x|θ)p(θ)dθ
– a posteriori : p(θ|x)
La formulation bayésienne permet d’introduire de l’information à priori dans le processus
d’estimation. Par exemple, imaginons que nous jouions à pile ou face :
– avec un jeton « inconnu », nous n’avons aucune information a priori : nous utiliserons
la loi uniforme pour p(θ).
– avec une pièce de monnaie « normale », nous utiliserons une distribution de masse
importante autour de 0,5 pour p(θ).
Pour un bayésien, proposer un estimateur "ponctuel", comme l’estimateur du maximum
de vraisemblance qui propose une seule valeur de θn’est pas satisfaisant car l’estimateur
lui-même ne rend pas compte de l’incertitude intrinsèque au processus d’estimation ou d’ap-
prentissage. Son estimateur sera donc la densité a postériori obtenue en utilisant la règle de
Bayes, qui s’écrit en notation continue
p(θ|x) = p(x|θ)p(θ)
´p(x|θ)p(θ)dθ
Ainsi, le bayésien spécifie l’incertitude avec des distributions qui forment sont estimateur,
plutôt que de combiner un estimateur avec des intervalles de confiance.
Si le bayésien est contraint de produire un estimateur ponctuel, il utilise l’espérance de
la quantité sous-jacent sous la distribution a postériori ; par exemple pour θ:
µpost =E[θ|D] = E[θ|x1, x2, . . . , xn] = ˆθp (θ|x1, x2, . . . , xn)dθ
9.2.2 Maximum a posteriori (MAP)
θMAP = arg max
θp(θ|x1, x2, . . . , xn)
= arg max
θp(x1, x2, . . . , xn|θ)p(θ)
car, par la formule de Bayes :
p(θ|x1, x2, . . . , xn) = p(x1, x2, . . . , xn|θ)p(θ)
p(x)
Le Maximum a posteriori n’est pas vraiment Bayésien, c’est plutôt une petite modification
apportée à un estimateur fréquentiste.
9-5