Machine Learning avec Weka
Module X8II090 - Cours 2
Florian Boudin
Département informatique, Université de Nantes
Révision 1 du 4 janvier 2012
Plan
Préambule
Clustering
Interface Knowledge Flow
Utiliser Weka dans votre code
Conclusion
04 jan 2012 / Rév. 1 - page 2 sur 47
Quiz sur les notions vues précédemment
1. Qu’est ce que Weka ?
ISuite de logiciels d’apprentissage automatique et d’exploration de
données écrite en Java
2. Quel est l’évaluation la plus fiable ? l’algo le plus performant ?
IAlgo1, 81.3% d’instances correctement classées en découpage 2
3/1
3
IAlgo2, 78.4% de précision en validation croisée 10 strates
IAlgo3, 72.1% de f-mesure en validation croisée 10 strates
3. A quoi sert une matrice de coût ?
ILes erreurs des classifieurs sont inévitables puisqu’aucun modèle n’est
parfait ! Les matrices de coût permettent d’intégrer le fait que
certaines erreurs sont pires que d’autres
04 jan 2012 / Rév. 1 - page 3 sur 47
Quiz sur les notions vues précédemment
1. Qu’est ce que Weka ?
ISuite de logiciels d’apprentissage automatique et d’exploration de
données écrite en Java
2. Quel est l’évaluation la plus fiable ? l’algo le plus performant ?
IAlgo1, 81.3% d’instances correctement classées en découpage 2
3/1
3
IAlgo2, 78.4% de précision en validation croisée 10 strates
IAlgo3, 72.1% de f-mesure en validation croisée 10 strates
3. A quoi sert une matrice de coût ?
ILes erreurs des classifieurs sont inévitables puisqu’aucun modèle n’est
parfait ! Les matrices de coût permettent d’intégrer le fait que
certaines erreurs sont pires que d’autres
04 jan 2012 / Rév. 1 - page 3 sur 47
Le problème des probabilités nulles
Taille Style Utilité Mignon
petit coloré utile oui
petit pas coloré inutile oui
grand coloré inutile non
grand pas coloré utile non
petit coloré inutile ? ? ?
ICalculer P(oui|E)et P(non|E)
IRappel : P(H|E) = P(E|H)×P(H)
P(E)
P(oui|E) = P(petit|oui)·P(coloré|oui)·P(inutile|oui)·P(oui)/P(E)
P(oui|E) = 2/2·1/2·1/2·1/2=0.125
P(non|E) = P(petit|non)·P(coloré|non)·P(inutile|non)·P(non)/P(E)
P(non|E) = 0/2·1/2·1/2·1/2=0Lissage
04 jan 2012 / Rév. 1 - page 4 sur 47
1 / 78 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !