4 Journées de Statistique 2003.
– tout d’abord, en utilisant une approximation de la probabilité a posteriori du
couple de partitions de type pseudo-vraisemblance [BES 75], semblable à celle qui
est développée dans le cas des champs de Markov caché
P(zikwj` = 1|x, θ(c)) = P(zik = 1|x, θ(c))P(wj` = 1|x, θ(c)),
nous remplaçons la fonction Qpar la fonction suivante :
˜
Q(θ, θ(c)) = X
ik
c(c)
ik log pk+X
j`
d(c)
j` log q`+X
ijk`
c(c)
ik d(c)
j` log ϕk`(xj
i;α`
k)
où c(c)
ik =P(zik = 1|x, θ(c))et d(c)
j` =P(wj` = 1|x, θ(c));
– nous proposons dans un second temps de maximiser cette expression à l’aide
d’un algorithme alterné obtenu en fixant respectivement les probabilités cik puis les
probabilités dj`. Dans les deux deux cas, on obtient alors simplement des versions
classiques de l’algorithme EM appliquées à des modèle de mélanges issus du modèle
de mélange croisé.
On peut alors montrer que cet algorithme a les propriétés habituelles de conver-
gence de l’algorithme EM et qu’en particulier, il permet de construire une suite crois-
sante d’une approximation de la vraisemblance L(θ, x).
4. Bibliographie
[BES 75] BESAG J., « Statistical analysis of lattice systems », The Statistician, vol. 24, 1975,
p. 179-195.
[CEL 92] CELEUX G., GOVAERT G., « A Classification EM Algorithm for Clustering and
Two Stochastic Versions », Computational Statistics and Data Analysis, vol. 14, no3,
1992, p. 315-332.
[GOV 77] GOVAERT G., « Algorithme de classification d’un tableau de contingence », First
international symposium on data analysis and infomatics, Versailles, 1977, INRIA, p. 487-
500.
[GOV 83] GOVAERT G., Classification croisée, Thèse d’État, Université Paris 6, France, 1983.
[GOV 95] GOVAERT G., « Simultaneous Clustering of Rows and Columns », Control and
Cybernetics, vol. 24, no4, 1995, p. 437-458.
[GOV 03] GOVAERT G., NADIF M., « Clustering with block mixture models », Pattern Re-
cognition, vol. 36, no2, 2003, p. 463-473.
[HAR 75] HARTIGAN J. A., Clustering Algorithms, Wiley, New York, 1975.
[SYM 81] SYMONS M. J., « Clustering Criteria and Multivariate Normal Mixture », Biome-
trics, vol. 37, 1981, p. 35-43.