Environnement Weka Page 3 sur 28 26/01/2006
I. Introduction
Ce document se veut une présentation de l’environnement Weka et de son utilisation illustrée à
travers des exemples. Dans cette section, nous allons donner une description sommaire de
l’environnement Weka en commençant par sa définition, son rôle et ses différentes
fonctionnalités assurées par ses différents composants.
Avant d’utiliser cet environnement dans différentes expérimentations, il est nécessaire que les
données utilisées à cet effet-la soient transcrites selon un format; une mise en forme des données.
En d’autres termes, les données doivent être conformes aux formats de données disponibles au
niveau de l’environnement Weka.
Nous avons choisi différents datasets inclus dans le package Weka pour les trois outils Explorer,
Experimenter et KnowledgeFlow environment pour explorer les différentes facettes de
l’environnement Weka.
Ce document est structuré principalement en trois grandes parties qui représentent les trois outils
fournis par l’environnement Weka à savoir l’Explorer, l’Experimenter et le KnowledgeFlow.
Ainsi, la première section sera consacrée à l’outil Explorer en définissant son rôle et ses
fonctionnalités qui seront illustrées à travers un exemple. La seconde décrira le rôle et les
différentes étapes de l’exécution d’une expérimentation par l’outil Experimenter. Ces étapes sont
expliquées aussi via un exemple illustrant les différentes fonctionnalités de cet outil. La dernière
section présentera l’outil KnowledgeFlow, son rôle et ses différentes fonctionnalités. Dans cette
même section, nous présenterons comment construire un schéma de flux de connaissances en
utilisant les composants de Weka présents dans la barre des outils.
I.1 Description globale de Weka
Weka (Waikato Environment for Knowledge Analysis) est un environnement de fouille de
données développé par le groupe de recherche "machine learning" du département d’informatique
de l’université de Waikato en Nouvelle-Zélande. Il est utilisé dans le domaine de la recherche, de
l’éducation et de l’industrie. Il est écrit dans le langage Java et testé sur plusieurs plateformes tels