Résumé
L'introduction du Data Mining dans les systèmes d’information est devenue très
enthousiasmante. La technique des règles d’association est très utilisée pour extraire des
connaissances utiles. Elle repose sur deux étapes : la recherche des items fréquents, et la
génération des règles d’association. Néanmoins son inconvénient majeur est le nombre
important des règles générées, d’où la nécessite d’un post-traitement pour choisir
manuellement les règles utiles. Ceci nécessite beaucoup de temps en plus de l’expertise
demandée. Pour résoudre ce problème, plusieurs propositions ont été faites pour faire appel aux
ontologies ou aux schémas de règles afin de générer les règles pertinentes.
Cependant, le nombre important des règles à traiter reste toujours difficile à surpasser.
Notre proposition consiste à introduire dés le début le filtrage des règles utiles en se basant sur
des schémas de règles préalablement choisis par l’expert du domaine. Ce choix est fait en
utilisant une ontologie proposée pour le champ d’étude. Par la suite, la génération des règles
concerne juste celles qui respectent les schémas de règles choisis. Grâce à l’implication du
choix de l’expert dés le début du processus, cette approche permet de réduire le temps et le
coût du traitement, et procéder ainsi à l’optimisation et la compréhension des tendances
générales. Pour illustrer cette approche, une étude de cas est réalisée sur le domaine de
production du système d’information de l’entreprise Sonatrach/Aval.
Mots clés : Data Mining, fouille de données, règles d'associations, post-traitement, schémas de
règles, connaissances de domaine, système de production, ontologies.
Abstract
The technique of the association rules model in data mining is very useful for extraction
knowledge. But it generates a huge quantity of rules which requires an adapted post-processing
in order to target the most useful rules. For resolve this problem, several researches propose to
explicitly integrate user's domain knowledge with ontology, and then select the most useful
rules after generating all rules. This article proposes a new approach for integrate user's domain
knowledge before generating any association rule. By using ontology associated with the rules
patterns, we propose to introduce this knowledge at the first of the treatment before the
generation of association rules. In results, only the association rules which respect the rules
patterns will be generated. This method allows reducing execution time and minimizing cost of
the post- processing. This approach is illustrated by an example applied on production domain,
which is a part of the information system of Sonatrach/Aval Company.
Keywords: Data mining, domain knowledge, association rules, rules patterns, post-processing,
production system, and ontology.