M1 ISD Statistique Bayésienne
5.3 L’algorithme d’augmentation des données
D’une manière générale, l’algorithme d’augmentation des données (algorithme TW pour “de
Tanner et Wong”) a pour objet le calcul d’une loi conditionnelle. On peut donc l’utiliser en
particluier pour calculer la loi a posteriori. L’idée est d’obtenir une approximation de π(θ|x)
par augmentation des données (data augmentation) en décomposant la loi d’intérêt supposé
«compliquée» en un mélange de lois plus « faciles ». Pour ce faire, on essayera de mettre la loi
sous la forme :
π(θ|x) = ZZ
π(θ|z, x)π(z|x)dz (5)
où on a introduit une variable zvariables latentes telle que les lois π(θ|x;z)et π(z|x)sont
accessibles, connues.
De sorte que, pour simuler suivant π(θ|x), on pourra choisir un composant de ce mélange
suivant π(z|x), puis simuler suivant π(θ|x;z).
En pratique, on approxime l’intégrale (5) par :
1
m
m
X
j=1
π(θ|x;zj)
où les zjsont des réalisations de π(z|x).
Exemple – Supposons que l’on observe x= (x1, x2, x3, x4) = (125,18,20,34), la répartition en
quatre classes d’un groupe d’animaux de taille n= 197. Cette répartion suit une loi multinomiale
pour laquelle on se donne les valeurs de paramètres suivantes :
1
2+θ
4,1−θ
4,1−θ
4,θ
4, θ ∈[0,1].
Si l’on se donne une loi uniforme sur R+pour loi a priori sur θ, la loi a posteriori est :
π(θ|x)∝1
2+θ
4x11−θ
4x21−θ
4x3θ
4x4
Augmentons les données en divisant la première cellule par 2 cellules de probabilités 1/2 et θ/4.
Posons z1+z2=x1,z2=x3,z3=x4et z4=x5. Ces données augmentées z= (z1, z2, z3, z4, z5)
suivent un loi multinomiale de paramètres :
1
2,θ
4,1−θ
4,1−θ
4,θ
4,
et tout calcul fait la loi a posteriori prend une forme de loi Bêta :
π(θ|x, z)∝θz2+z5(1 −θ)z3+z4.
La loi de zconditionnellement à xest obtenue par le rapport des multinomiales qui est, en fait, la
loi de (z1, z2)conditionnellement à xet qui revient à considérer une loi binomiale de paramètres
23