Weka

publicité
Weka
Introduction au data mining
IFT3335 - DIRO
Weka
 Waikato Environment for Knowledge Analysis
 Fouille de données et apprentissage
 Package JAVA
 GUI et CLI
 Utilisation
 Copie disponible à /u/dift3335/Public/Weka!
 java -classpath $CLASSPATH:weka.jar:libsvm.jar
weka.gui.GUIChooser !
 Aide
 Manuel disponible dans le répertoire
 http://www.cs.waikato.ac.nz/ml/weka/
Weka
 Pré-traitement des données
 Sélection, transformation, combinaison d’attributes
 Normalisation
 Ré-echantillonnage ..
 Exécution de la tâche
 Classification!
 Regression
 Clustering
 Analyse des Résultats
 Comparaison d’algorithmes!
Weka – GUI/CLI
Dataset / ARFF
Pré-traitement
 Filtres
 weka.filters!
 Non supervisés
 weka.filters.unsupervised!
 Ajout/Suppression/copie d’attributs
 Conversion (NominalToBinary, ..)
 Supervisés
 weka.filters.supervised!
 Discrétisation (Discretize, ..)
 Attention à l’évaluation des résultats
L’apprentissage
 Algorithmes de classification inclus
 Arbres de décision
 SVM
 MLP
 Classification Bayésienne Naïve, …
 Méta-Classifieurs
 Combinaison
 Bagging
 Boosting
Evaluation / Analyse
 Mesures de performance
 Matrice de confusion
 Precision / Recall / F-Measure
 Visualisation des résultats
 Scatter plots
 Grid plots
 Error plots
Exemples
 Arbres de décision!
 Classification
 Régression
 Clustering
Téléchargement