Introduction au Data Mining

Téléchargement

Introduction au Data Mining et

à l’apprentissage statistique

Gilbert Saporta

Chaire de Statistique Appliquée & CEDRIC, CNAM,

292 rue Saint Martin, F-75003 Paris

[email protected]

http://cedric.cnam.fr/~saporta

Plan

Qu’est-ce que le data mining?

Trois méthodes emblématiques

2.1 Règles d’associations

2.2 Arbres de décision

2.3 Scoring

Performance des méthodes de prévision

Construction et choix de modèles: théorie de

l’apprentissage

Le DM, une nouvelle conception de la statistique et

du rôle des modèles

1. Qu’est-ce que le Data

Mining?

Le Data Mining est un nouveau champ situé

croisement de la statistique et des technologies de

l’information (bases de données, intelligence

artificielle, apprentissage etc.) dont le but est de

découvrir des structures dans de vastes ensembles de

données.

Deux types: modèles et «

patterns

(ou comportements)

(D.Hand)

1.1 Définitions:

U.M.Fayyad, G.Piatetski-Shapiro

“ Data Mining is

the nontrivial process of identifying valid, novel,

potentially useful, and ultimately understandable

patterns in data ”

D.J.Hand

“

I shall define Data Mining as the

discovery of interesting, unexpected, or valuable

structures in large data sets”

La métaphore du Data Mining signifie qu’il y a des

trésors ou pépites

cachés sous des montagnes de

données que l’on peut découvrir avec des outils

spécialisés.

Le Data Mining analyse des données recueillies à

d’autres fins: c’est

une analyse secondaire

de bases

de données, souvent conçues pour la gestion de

données individuelles

(Kardaun, T.Alanko,1998)

Le Data Mining ne se préoccupe donc pas de

collecter des données de manière efficace

(sondages, plans d’expériences)

(Hand, 2000)

1 / 82 100%

Documents connexes

titre sur 1 ou 2 lignes maximum

Stage en Data Mining - Machine Learning Group

Fiche-UE_CODE_CR_OPT_DM - LIRIS

Glossaire

8INF954 : Forage de données -Data mining

Data Mining : Techniques et Applications

Télécharger le programme de la formation

Data/Pattern Analysis

Systèmes Artificiels Complexes

Extraction de connaissance

M1 MIAGE Option IFD Ethique et Data Mining

Application bancaire du data mining Prédiction du chiffre d`affaires

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Introduction au Data Mining

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Introduction au Data Mining

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib