Didacticiel‐Étudesdecas R.R.
3octobre2011 Page3
pasfréquent,alorsBneleserapaségalement.Cerésultatpermetderéduireconsidérablement
l’espacederecherchelorsdel’extractiondesitemsetsfréquentsdansunebasededonnées.
Itemsetfermé(closeditemset).Unitemsetfréquentestditfermésiaucundesessupersetsn’ade
supportidentique.Autrementdit,toussessupersetsontunsupportstrictementplusfaible.Dans
notreexempleci‐dessus,{S1,S3}estfermécaraucundesessupersetsn’adesupportégalà5/10:
SUP({S1,S2,S3})=3/10,SUP({S1,S3,S4})=1/10.
Itemsetmaximal(maximalitemset).Unitemsetestditmaximalsiaucundesessupersetsn’est
fréquent.Dansnotreexempleci‐dessus,{S1,S2,S3}estmaximalcarsonsuperset{S1,S2,S3,S4}(il
n’yenaqu’un)n’estpasfréquentavecunsupportde1/10.
Itemsetgénérateur(generatoritemset).UnitemsetAestditgénérateurs’iln’existeaucunitemset
BtelqueB⊂AetqueSUP(B)=SUP(A).Autrementdit,l’itemsetestgénérateursitoussessous‐
itemsetsontunsupportstrictementsupérieur.Dansnotreexemple,{S1,S2,S3}desupport4/10
n’estpasgénérateurpuisqu’ontrouve{S1,S2}avecunsupportidentique.Ilenestdemêmeencequi
concerne{S1,S3}àcausede{S1}.Enrevanche,{S2,S4},desupport2/10,estgénérateurparceque
SUP({S2})=7/10etSUP({S4})=3/10.
3 Extraction des itemsets à l’aide de Tanagra
Nouschargeonslefichier«itemset_mining.xls»dansletableurExcel.Noussélectionnonslaplage
dedonnées,puisnousactionnonslemenuTANAGRA/EXECUTETANAGRAinstalléàl’aidedela
macrocomplémentairetanagra.xla3.
Tanagraestautomatiquementdémarréetlesdonnéeschargées.
3Voirhttp://tutoriels‐data‐mining.blogspot.com/2010/08/ladd‐in‐tanagra‐pour‐excel‐2007‐et‐2010.htmlpour
l’installationetl’utilisationdelamacrodansExcel2007et2010.Elleestégalementfonctionnellesousles
versionsantérieuresd’Excel(http://tutoriels‐data‐mining.blogspot.com/2008/03/importation‐fichier‐xls‐excel‐
macro.html‐Excel97à2003).Enfin,uneprocédureanalogueexistepourOpenOfficeetLibreOffice(voir
http://tutoriels‐data‐mining.blogspot.com/2011/07/tanagra‐addon‐pour‐openoffice‐33.html).