3
Définition du Data Mining
Le data Mining (traduire : fouille de
données, extraction de connaissance ECD
ou KDD) : nouveau champ d’application
intégrant des techniques provenant de
diverses disciplines : la Statistique,
l’Intelligence Artificielle et l’Informatique
(Base de données , ICHM...)
La définition exacte est peu claire et les
terminologies associées au Data-Mining
sont parfois encore floues.
Définition du Data Mining
Fayyad, Piatetsky-Shapiro et Smyth :
“ Knowledge
Discovery in Databases is the non-trivial process of
identifying valid, potentially useful, and ultimately
understandable patterns in data ”
(extraction non triviale des
bases de données, de connaissances implicites, inconnues à l’avance et
potentiellement utiles.)
D.J.Hand:
“I shall define Data Mining as the discovery of
interesting, unexpected, or valuable structures in large
data sets”
Objectif : essayer ‘de tirer quelque chose’ des informations
disponibles dans les bases de données opérationnelles dans l’optique
d’augmenter la performance des entreprises.
9
La métaphore du Data Mining signifie qu’il y a
des trésors ou pépites cachés sous des
montagnes de données que l’on peut découvrir
avec des outils spécialisés.
Le Data Mining analyse des données recueillies
à d’autres fins: c’est
une analyse secondaire
de
bases de données, souvent conçues pour la
gestion de données individuelles (Kardaun,
T.Alanko,1998)
Le Data Mining ne se préoccupe donc pas de
collecter des données de manière efficace
(sondages, plans d’expériences) (Hand, 2000)
Saporta 2013