´
Ecole Polytechnique Florent Benaych-Georges
Ann´ee 2 Stefano De Marco
Math´ematiques Appliqu´ees St´ephane Gaiffas
TP6 Emmanuel Gobet
MAP441 – Modal SNA Christelle Verg´e
Algorithme EM, m´elanges gaussiens, clustering
et s´election de mod`ele
1 Introduction
Dans ce TP, nous proposons de mettre en oeuvre la m´ethode d’optimisation d´ecrite en cours 5 : l’algorithme
EM, appliqu´e `a la maximisation de la vraisemblance dans le mod`ele de m´elange gaussien, puis de s’en servir
pour effectuer un clustering de points dans le plan. On pourra ensuite, si le temps le permet, utiliser la
m´ethode BIC pour s´electionner automatiquement le nombre de clusters.
Il faudra travailler entre 1h et 1h30 sur ce TP, pas plus, le but ´etant maintenant de travailler principalement
sur votre projet. Pour vous faire gagner du temps, nous fournissons un code `a trou, disponible sur la page
http://www.cmap.polytechnique.fr/~gaiffas/index.php?main=teaching
le but ´etant de compl´eter le code scilab pour traiter les questions, sans avoir `a g´erer les probl`emes de
programmation scilab associ´es.
2 M´elanges gaussiens
La densit´e d’un m´elange gaussien `a Kclusters, de param`etre θ= (p1, . . . , pK, µ1, . . . , µK,Σ1,...,ΣK)∈Θ
s’´ecrit
fθ(x) =
K
X
k=1
pkφµk,Σk(x),
o`u φµk,Σkest la densit´e de la loi gaussienne N(µk,Σk) donn´ee par
φµk,Σk(x) = 1
(2π)d/2pdet(Σk)exp −1
2(x−µk)>Σ−1
k(x−µk),
et o`u l’ensemble de param`etres est
Θ = n(p1, . . . , pK)∈(R+)K:
K
X
k=1
pk= 1o×RK×d×(S0)K,
avec S0={Σ∈Rd×d: Σ>= Σ,Σ0}.
Question 1. Simuler n= 1000 r´ealisations d’un m´elange gaussien de param`etres
•K= 3, decal = 5, σ= 2
•p= (p1, p2, p3) = (0.3,0.5,0.2)
•µ1= (−decal, decal), µ2= (decal, decal), µ3= (0,−decal)
•Σ1=σ2I2, Σ2=σ2I2, Σ3=σ2I2o`u Idest la matrice identit´e dans Rd.
Compl´eter pour cela les trous dans le fichier sim_gauss_mixture_question.sce (qui contient la fonction
de simulation) et lancer le calcul avec le fichier sim_gauss_mixture_main.sce. On pourra jouer sur les
param`etres decal et σ, rajouter des clusters, etc, pour observer l’impact sur les points simul´es.
1