a) Affichage de données multidimensionnelles (affichage de Sammon)

publicité
Travaux pratiques de Reconnaissance de Formes
1ère séance /4
Modalités de déroulement
Un compte-rendu doit m’être remis à la fin de la séance sous forme papier ou par mail
sous forme d’un fichier unique. Le nombre de pages doit être limité au maximum.
Si vous n’avez pas le temps de répondre à toutes les questions pendant la séance, vous
pouvez me faire parvenir un complément de compte-rendu avant la séance suivante (par
exemple par mail).
Toutes les informations nécessaires aux TP sont accessibles à partir de la page web RdF.
a) Affichage de données multidimensionnelles (affichage de Sammon)
Programmation : Utilisation de la SOM Toolbox
1) Appliquer la méthode de Sammon aux données Iris et Wine. Recommencer avec les
données normalisées, c’est à dire quand chaque caractéristique est comprise entre 0 et 1.
b) Algorithme des k plus proches voisins (KPPV)
Programmation C
2) Appliquer le programme kppv.c aux données Iris et Wine. Dans le cas des données Wine,
montrer que le taux de classification correcte est meilleur lorsque les vecteurs sont
normalisés. Expliquer pourquoi.
3) Tester la stabilité de l’algorithme en exécutant plusieurs fois le programme (par exemple
en programmant une boucle d’une centaine d’itérations), et en montrant que les taux
d’erreur minimal et maximal sont proches du taux moyen.
Utilisation du LVQ_PAK
4) En utilisant l’utilitaire knn_test du LVQ_PAK, appliquer la méthode des KPPV, avec k=1
aux données Wine. Rechercher la valeur de k donnant les meilleurs résultats. Préciser les
lignes de commande lancées, ainsi que le résultat obtenu.
Remarque : Les utilitaires du LVQ_PAK nécessitent un format de fichier un peu différent
(voir le fichier de données lvq_iris.dat, qui est bien formaté).
Benoît Decoux, novembre 2001
1
c) Algorithme des nuées dynamiques
Programmation C
4) Appliquer le programme nuees.c aux données Wine. Tester la stabilité de l’algorithme en
exécutant plusieurs fois le programme. En utilisant la fonction calcul_moyenne2() du
fichier rdf.c pour initialiser l’algorithme avec la moyenne de quelques exemples, montrer
que la stabilité de l’algorithme est meilleure.
d) Apprentissage compétitif non-supervisé (VQ : Vector Quantization)
Programmation C
5) Utiliser la fonction adapt_regle_compet_nonsup() du fichier rdf.c pour transformer
l’algorithme des nuées dynamiques en apprentissage compétitif non-supervisé. Le tester
avec les données Wine, avec le programme "stable" de la question précédente.
Programmation Matlab
6) Utiliser la fonction newc de Matlab pour construire un classifieur utilisant la méthode VQ.
Ce classifieur sera construit et testé avec les mêmes données.
Benoît Decoux, novembre 2001
2
Téléchargement