ESILV 30/06/2006
M. Crucianu 4
30 juin 2006 ESILV 7
Règles d’association
Recherche de règles du type
« si pour une observation la variable X1 a la valeur vx1 et la
variable X2 la valeur vx2, alors avec une probabilité de 0,9 la
variable Ya la valeur vy »
Caractérisation d’une règle
Support :
Confiance :
Lift :
Critères de sélection des règles
Support et confiance : supérieurs à des seuils (entre 0 et 1)
Lift : nettement supérieur à 1
( )
( ) ( )
YPXP
XYP
YP
XYP ∩
=
XYP
XYP ∩
30 juin 2006 ESILV 8
Classification automatique
(cluster analysis, clustering)
Objectif général : répartir un ensemble donné d’individus en
groupes (catégories, classes, taxons, clusters) de façon à
regrouper les individus similaires et à séparer les individus
dissimilaires
Aucune information n’est disponible concernant l’appartenance de
certaines données à certaines classes ; le nombre de groupes
recherchés peut être connu a priori ou non
Utilisations :
Mettre en évidence une structure (simple) dans un ensemble de
données
Résumer un grand ensemble de données par les représentants des
groupes