
Concepts de base (3)
• Les données sont des données ensemblistes
▫ chaque transaction est un ensemble d’objets
• La génération des règles d’associations consiste
à trouver les corrélations intéressantes
entre les données
Les règles seront modélisées sous forme logique
Les règles seront modélisées sous forme logique
antécédent ⇒conséquent
• Règles intéressantes: besoin d’une mesure
pour quantifier la qualité des règles?
Fréquence d’un ensemble (1)
} désigne un ensemble d’objets
} désigne un ensemble d’objets
•D= {T1, T2, …, Tm} est un ensemble de
transactions tel que Ti ⊆I ; ∀Ti∈D
• On note par k-ensemble tout ensemble de
taille k (contenant k objets)
• Une transaction Test dite contenir un ensemble
• La fréquence d’un ensemble A est le nombre de
transactions dans D contenant A
Fréquence d’un ensemble (2)
•I= {I1, I2, I3, I4, I5}
7
TID Liste d’objets
•D= {T100, T200, …, T900}
•A= {I1, I2} est un 2-ensemble
puisqu’il contient deux objets
• Les transactions T100, T400,
T200 I2, I4
T300 I2, I3
T400 I1, I2, I4
T500 I1, I3
T600 I2, I3
l’ensemble A
• Ainsi la fréquence de Aest égal
à quatre
T800 I1, I2, I3, I5
T900 I1, I2, I3
Une règle d’association est une
Une règle d’association est une
B tels que
▫ A ⊂I, B ⊂I; et
▫ A ∩B = ∅
• Pour mesure la qualité d’une règle d’association,
on va utiliser deux indices :