de KGaussiennes dans Rd(dans cet exercice, d= 2 et K= 4), avec des donn´ees IID.
(NB : dans cet exercice, il n’est pas n´ecessaire de d´emontrer les formules utilis´ees).
Le langage de programmation est libre (MATLAB, Octave, Scilab ou R sont n´eanmoins
recommand´es). Le code source doit ˆetre remis avec les r´esultats. Le corrig´e sera cod´e
en MATLAB.
(a) Impl´ementer l’algorithme K-means (chapitre 10 du polycopi´e). Repr´esenter gra-
phiquement les donn´ees d’apprentissage, les centres obtenus et les diff´erents
groupes (“clusters”). Essayer plusieurs initialisations et comparer les r´esultats
(centres et mesures de distortions).
(b) Impl´ementer l’algorithme EM pour un m´elange de Gaussiennes avec des ma-
trices de covariance proportionnelles `a l’identit´e (initialiser l’algorithme EM
avec les moyennes trouv´ees par K-means).
Repr´esenter graphiquement les donn´ees d’apprentisage, les centres et les co-
variances obtenus (une mani`ere ´el´egante de repr´esenter graphiquement est de
repr´esenter l’ellipse contenant un certain pourcentage (e.g., 90%) de la masse
de la Gausienne). Estimer et repr´esenter la variable latente pour chaque point
(pour le jeu de param`etres appris par EM).
(c) Impl´ementer l’algorithme EM pour un m´elange de Gaussiennes avec des ma-
trices de covariance g´en´erales. Repr´esenter graphiquement les donn´ees d’appren-
tisage, les centres et les covariances obtenus. Estimer et repr´esenter la variable
latente pour chaque point (pour le jeu de param`etres appris par EM).
(d) Commenter les diff´erents r´esultats obtenus. En particulier, comparer les log-
vraisemblances des deux mod`eles de m´elanges, sur les donn´ees d’apprentissage,
ainsi que sur les donn´ees de test (dans “EMGaussienne.test”).
2