i
TABLE DES MATIERES
INTRODUCTION........................................................................................................ 2
I. DES ENTREPOTS DE DONNEES A LA FOUILLE DE DONNEES ....................... 7
I.1. Introduction.................................................................................................................................................... 7
I.2. Entrepôts de données ..................................................................................................................................... 8
I.2.1. Datamarts................................................................................................................................................ 9
I.2.2. Modélisation des entrepôts de données............................................................................................... 10
1.2.2.1. Les tables....................................................................................................................................... 10
I.2.2.2. Les modèles.................................................................................................................................... 11
I.3. Fouille de données......................................................................................................................................... 12
I.4. Techniques de Fouille de Données............................................................................................................... 14
I.5. Règles d'Association..................................................................................................................................... 15
I.5.1. Quelques concepts de base................................................................................................................... 16
I.5.2. Processus de Génération des Règles d'Association:........................................................................... 17
I.6. Conclusion..................................................................................................................................................... 22
II. PROCESSUS D'EXTRACTION DES ITEMSETS FREQUENTS......................... 24
II.1. Introduction................................................................................................................................................. 24
II.2. Algorithmes d'extraction des itemsets fréquents...................................................................................... 24
II.2.1. L’algorithme Apriori .......................................................................................................................... 24
II.2.1.1. Propriétés..................................................................................................................................... 25
II.2.1.2. Pseudo-code de L’algorithme..................................................................................................... 25
II.2.1.3. Problèmes d’Apriori.................................................................................................................... 30
II.2.1.4. Amélioratios d’Apriori................................................................................................................ 30
II.2.2. L'algorithme Bitmap........................................................................................................................... 33
II.2.3. L'algorithme FP-Growth.................................................................................................................... 34
II.2.4. L'algorithme DualFilter-Probe.......................................................................................................... 35
II.2.5. L'algorithme ITL - Mine .................................................................................................................... 36
II.2.6. L'algorithme PatriciaMine................................................................................................................. 37
II.2.7. L'algorithme Transaction Mapping (TM)........................................................................................ 38
II.2.8. Classification des algorithmes............................................................................................................ 38
II.2.8.1. Stratégie de Calcul du Support .................................................................................................. 39
II.2.8.2. Direction de Recherche............................................................................................................... 40
II.2.8.3 Stratégie de recherche.................................................................................................................. 40
II.2.9. Conclusion............................................................................................................................................ 42
II.3. Structure de données pour l'extraction des itemsets fréquents............................................................... 42
II.3.1. Introduction......................................................................................................................................... 42
II.3.2. Représentation de la Base des Transactions ..................................................................................... 43
II.3.2.1. Classification des schémas de représentation............................................................................ 43
II.3.2.2. Exemples de Structures de données........................................................................................... 44
II.3.3. Stockage des Candidats ...................................................................................................................... 48
III.3.3.1. Arbre de hachage....................................................................................................................... 48
III.3.3.2. Trie.............................................................................................................................................. 51
II.3.3.3. Arbre Lexicographique............................................................................................................... 51
III.3.4. Conclusion.......................................................................................................................................... 52