La fouille de données : qu’est-ce que c’est ?
Fouille de données / data mining
Ensemble d’approches statistiques permettant d’extraire de l’information
de grands jeux de données dans une perspectives d’aide à la décision.
Les étapes du data mining 1
1. Nettoyage des données (erreurs, données manquantes, outliers)
2. Transformation éventuelle des données (normalisation, linéarisation...)
3. Explicitation de l’objectif de l’analyse en terme statistique (régression,
classification, clustering...)
4. Choix de la méthode et mise en oeuvre informatique ( ...)
5. Test (validation de la qualité des résultats)
6. Exploitation
1P. Besse et al., Data Mining et Statistique, Journal de la Société Française de
Statistique, 142[1], 2001.
2 / 79