Weka Introduction au data mining IFT3335 - DIRO Weka Waikato Environment for Knowledge Analysis Fouille de données et apprentissage Package JAVA GUI et CLI Utilisation Copie disponible à /u/dift3335/Public/Weka! java -classpath $CLASSPATH:weka.jar:libsvm.jar weka.gui.GUIChooser ! Aide Manuel disponible dans le répertoire http://www.cs.waikato.ac.nz/ml/weka/ Weka Pré-traitement des données Sélection, transformation, combinaison d’attributes Normalisation Ré-echantillonnage .. Exécution de la tâche Classification! Regression Clustering Analyse des Résultats Comparaison d’algorithmes! Weka – GUI/CLI Dataset / ARFF Pré-traitement Filtres weka.filters! Non supervisés weka.filters.unsupervised! Ajout/Suppression/copie d’attributs Conversion (NominalToBinary, ..) Supervisés weka.filters.supervised! Discrétisation (Discretize, ..) Attention à l’évaluation des résultats L’apprentissage Algorithmes de classification inclus Arbres de décision SVM MLP Classification Bayésienne Naïve, … Méta-Classifieurs Combinaison Bagging Boosting Evaluation / Analyse Mesures de performance Matrice de confusion Precision / Recall / F-Measure Visualisation des résultats Scatter plots Grid plots Error plots Exemples Arbres de décision! Classification Régression Clustering