Introduction à Weka

publicité
DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI
LOG770 - SYSTÈMES INTELLIGENTS
ÉTÉ 2012
Introduction à Weka
Enseignant : Christian Desrosiers
Chargée de laboratoire : Faten M’hiri
Classification ou clustering ?
Problème
Type d'apprentissage
Algorithmes
Classification
Supervisé:
On possède les attributs
et l'étiquette (i.e., classe
de sortie) des exemples
d'entraînement
SVM, k-NN, arbres de
décisions, classification de
Bayes naïve, etc.
Groupement
(Clustering)
Non supervisé:
On ne possède que les
attributs des exemples
d'entraînement
k-moyennes, mélange de
modèles gaussiens, etc.
Classification
• Collecter les données :
– Données d’apprentissage : pour entraîner le
classifieur
– Données de tests : pour évaluer le classifieur
• Choisir l’ensemble de caractéristiques pour les décrire
(descripteurs)
• Sélectionner d’un algorithme de classification supervisé
• Entraîner le classifieur (avec les données
d’apprentissage)
• Évaluer la performance du classifieur (avec les données
de test)
Introduction à Weka
• Logiciel d’apprentissage machine :
– Traitement de données
– Forage de données
– Comparaison d’algorithmes
– Etc.
• Site web:
http://www.cs.waikato.ac.nz/ml/weka/index.html
Introduction à Weka
•
•
•
•
Lancer le logiciel
Choisir mode « Explorer »
GUI : Open File
Sélectionner le fichier : « Weka/data/weather.arff »
Exemple : weather.arff
• ARFF (Attribute-Relation File Format) :
– Caractéristiques décrivant la météo:
@relation weather
@attribute
@attribute
@attribute
@attribute
@attribute
outlook {sunny, overcast, rainy}
temperature real
humidity real
windy {TRUE, FALSE}
play {yes, no}
Exemple : weather.arff
• ARFF (Attribute-Relation File Format) (suite) :
– Ensemble de données :
@data
sunny,85,85,FALSE,no
sunny,80,90,TRUE,no
overcast,83,86,FALSE,yes
rainy,70,96,FALSE,yes
rainy,68,80,FALSE,yes
rainy,65,70,TRUE,no
overcast,64,65,TRUE,yes
sunny,72,95,FALSE,no
sunny,69,70,FALSE,yes
rainy,75,80,FALSE,yes
sunny,75,70,TRUE,yes
overcast,72,90,TRUE,yes
overcast,81,75,FALSE,yes
rainy,71,91,TRUE,no
Utilisation du GUI :
Exemple
No
No
Yes
Yes
Sunny
Overcast
Yes
Rainy
Utilisation du GUI :
Exemple
choisir l’algorithme
J48 dans la section
Trees
Liens
• http://www.cs.waikato.ac.nz/ml/weka/index.html
• http://www.dataminingtools.net/browsetutorials.php?tag=weka
• http://aqualonne.free.fr/Teaching/csc/DM.pdf
Téléchargement