Data Mining With Decision Trees

Téléchargement

DATA MINING

Arbres de décision

Juan Manuel Torres

[email protected]

www.lia.univ-avignon.fr/chercheurs/torres/cours/dm

LIA / Université d'Avignon

Octobre 2006

Généralités

Arbres de décision (1)



Structure de données utilisée comme modèle pour la

classification [Quinlan]



Méthode récursive basée sur diviser-pour-régner pour créer des

sous-groupes (plus) purs (un sous-groupe est pur lorsque tous les

éléments du sous-groupe appartiennent à la même classe)



Construction du plus petit arbre de décision possible

Arbres de décision (2)

Nœud = Test sur un attribut

Une branche pour chaque valeur d’un attribut

Feuilles : désignent la classe de l’objet à classer

Taux d’erreur: proportion des instances qui

n’appartiennent pas à la classe majoritaire de la

branche

Problèmes: Choix de l’attribut, terminaison

Algorithmes

2 algorithmes les plus connus et les plus utilisés (l'un ou

l'autre ou les deux sont présents dans les

environnements de fouille de données) : CART

(Classification And Regression Trees [BFOS84]) et C5

(version la plus récente après ID3 et C4.5 [Qui93]).



[BFOS84] L. Breiman, J. H. Friedman, R. A. Olshen, and C. J.

Stone. Classification and regression trees. Technical report,

Wadsworth International, Monterey, CA, 1984



[Qui93] J. R. Quinlan. C4.5: Programs for Machine Learning.

Morgan Kaufmann, San Mateo, CA, 1993

Découpages

Données IRIS

Les décisions

correspondent à des

découpages des

données en

rectangles

I.H. Witten and E. Frank, “Data Mining”, Morgan Kaufmann Pub., 2000.

Météo et match de foot

Attribut

2 classes: yes et

Prédire si un

match de foot va

avoir lieu ou non

Température est

un nominal

2 classes: yes et no

Température est un numérique

Météo et match de foot

I.H. Witten and E. Frank, “Data Mining”, Morgan Kaufmann Pub., 2000.

Quel attribut faut-il sélectionner?

Classe:

Classe

:YES

Classe

: YES

Arbre de décision final

1 / 27 100%

Documents connexes

RTF

Exercices sur l'attribut du sujet - Grammaire Française

Le sujet et l`attribut du sujet

Les adjectifs épithètes et attributs

La fonction attribut du sujet

Création de schéma On s`intéresse à une base de données de

Insuffisance cardiaque: faut

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Data Mining With Decision Trees

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Data Mining With Decision Trees

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib