2. Théorie :
2.1 Le datamining :
Le DataMining (appelé aussi Fouille de Données ou Extraction de la Connaissance) est
devenu un domaine de recherche important au fil des dernières années car avec le
développement des outils informatiques, nous avons assisté à un véritable déluge d’informations
stockées dans de grandes bases de données scientifiques, économiques, financières, médicales...
et afin d’obtenir des connaissances sur ces données, de nouvelles méthodes d’extraction de
l’information, le DataMining a été créé.
Ce nouveau domaine se situe au centre de plusieurs disciplines comme les Statistiques,
les Bases de Données, l’Algorithmique, les Mathématiques ou bien encore l’Intelligence
Artificielle.
Un problème classique du DataMining est la recherche de règles d’association dans les
données. Pour cela, les chercheurs se penchent sur deux sous-problèmes :
La génération des concepts : Il s’agit d’objets ayant les mêmes propriétés.
La recherche de règles du type « la présence de ce groupe d’objets implique la présence
de cet autre groupe d’objets ».
C’est lors de la génération des concepts qu’a lieu l’accès aux données, supposées de
grandes tailles. Cette phase a donc un temps d’exécution très long et l’objectif de la plupart des
algorithmes est bien entendu, de réduire ce coût.
Le but de ce projet était donc d’évaluer et de comparer les performances des trois
algorithmes sur des jeux de données de grande taille, afin d’évaluer leur mise en application
possible.
2.2 La relation :
Soit un ensemble fini Y, on appelle relation binaire R sur Y un sous-ensemble de YY,
c’est-à-dire R YY
Exemple :
Y = {a, b, c}
R = { (a, b), (b, c) }
On peut également étendre cette notion a une relation binaire entre deux ensembles Y et
Y’, appelée relation binaire externe. On a donc :
R YY’
Exemple :
Y = { a, b, c}
Y’ = {1, 2}
= { (a, 2), (c, 1), (b, 2) }
Dans le cadre de la théorie des concepts, les ensembles Y et Y’ de la relation binaire
externe R sont définis respectivement par l’ensemble P, P représentant l’ensemble des
propriétés de R, et par l’ensemble O, O représentant l’ensemble des objets de R. On a donc :
R PO.
De plus, les propriétés seront représentées par des lettres minuscules et les objets seront
représentés par des nombres.