1/67
Utilisation des modèles de mélange pour la
classification de données temporelles
Séminaire Laboratoire LSIS-DYNI, USTV
Allou Samé
Laboratoire GRETTIA - IFSTTAR
allou.same@ifsttar.fr
29/11/2012, Toulon
2/67
Classification Automatique
Données
nindividus décrits par pvariables : (x1,...,xn)
Matrice des dissimilarités/distances croisées entre les individus
Objectifs
Organisation des données en classes homogènes (clustering)
Représentation simplifiée, réduction, compression des
données
Apprentissage non supervisé
3/67
Structures associées
Partition en Kclasses (P1,...,PK)
z1
.
.
.
zn
=
z11 ··· z1K
.
.
.....
.
.
zn1··· znK
avec zik =1si xiPk
0sinon.
Hiérarchie (ensemble de partitions emboitées)
x1
x2
x4
x3
x5
x6
x7
x8
0 20 40 60 80 100 120
Height
4/67
Approches hiérarchiques
Algorithme de classification hiérarchique ascendante
Calcul d’un tableau de distances croisées si celui-ci n’est pas
fourni en entrée
Regrouper itérativement les classes en partant de la partition
la plus élémentaire (1 singleton par classe)
Fusionner successivement les classes jusqu’à obtenir 1 classe
Les regroupements successifs sont représentés sur un arbre
binaire (dendrogramme)
x1
x2
x4
x3
x5
x6
x7
x8
0 20 40 60 80 100 120
Height
5/67
Approches par partitionnement
Objectifs
Partitionner un ensemble de données en Kclasses
Algorithme K-means
Initialisation : tirage au hasard de Kobservations qui forment
les centres de gravité initiaux des classes
Tant que les classes ne sont pas stabilisées
1 affecter chaque observation à la classe dont le centre de
gravité est le plus proche au sens de la distance euclidienne
2 calculer des centres de gravité de la partition qui vient d’être
calculée
Critère optimisé
IW=
K
X
k=1 X
xiPk
kxigkk2
1 / 67 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !