Introduction Général
Durant ces dernières années, on assiste à une forte augmentation tant dans le
nombre que dans le volume des informations mémorisées par des bases de données
scientifiques, économiques, financières, administratives, médicales etc.
Trouver des relations entre les éléments stockés dans ces bases, et l'interprétation
est un besoin recommandé. Les chercheurs ont focalisé leurs intérêts dans les
nouvelles techniques informatiques afin de répondre à cette problèmatique. Le
"Knowledge Discovery in Databases" (KDD) et le "Data Mining" se sont deux
domaines émergeant répondant à ces objectifs.
Extraction de Connaissance à partir de Données ( Knowledge Discovery in
Databases ) est l'extraction d'information potentiellement utile et non connue, qui est
stockée dans des bases volumineuses. Ils permettent, grâce à plusieurs techniques
spécifiques, de faire apparaître des connaissances. Dans la littérature, KDD a
plusieurs objectifs, à savoir la classification, le regroupement, la régression, la
découverte de règles associatives, etc.
L'information extraite peut être exprimée sous forme d'un ensemble de règles
associatives, qui permettent de définir des liens entre les données, et par la suite,
prédire la conduite d'autres données différentes de celles stockées dans la base.
Le Data Mining ou Fouille de données est souvent vu comme un processus
équivalent au KDD, bien que la plupart des chercheurs voient en lui une étape
essentielle de la découverte de connaissance. C’est en effet une étape non triviale
du processus d’extraction de connaissance qui consiste à identifier des motifs
(patterns) valides, nouveaux, potentiellement utiles et compréhensibles à partir d’une
grande collection de données.