Benoît Decoux, novembre 2001 1
Travaux pratiques de Reconnaissance de Formes
1ère séance /4
Modalités de déroulement
Un compte-rendu doit m’être remis à la fin de la séance sous forme papier ou par mail
sous forme d’un fichier unique. Le nombre de pages doit être limité au maximum.
Si vous n’avez pas le temps de répondre à toutes les questions pendant la séance, vous
pouvez me faire parvenir un complément de compte-rendu avant la séance suivante (par
exemple par mail).
Toutes les informations nécessaires aux TP sont accessibles à partir de la page web RdF.
a) Affichage de données multidimensionnelles (affichage de Sammon)
Programmation : Utilisation de la SOM Toolbox
1) Appliquer la méthode de Sammon aux données Iris et Wine. Recommencer avec les
données normalisées, c’est à dire quand chaque caractéristique est comprise entre 0 et 1.
b) Algorithme des k plus proches voisins (KPPV)
Programmation C
2) Appliquer le programme kppv.c aux données Iris et Wine. Dans le cas des données Wine,
montrer que le taux de classification correcte est meilleur lorsque les vecteurs sont
normalisés. Expliquer pourquoi.
3) Tester la stabilité de l’algorithme en exécutant plusieurs fois le programme (par exemple
en programmant une boucle d’une centaine d’itérations), et en montrant que les taux
d’erreur minimal et maximal sont proches du taux moyen.
Utilisation du LVQ_PAK
4) En utilisant l’utilitaire knn_test du LVQ_PAK, appliquer la méthode des KPPV, avec k=1
aux données Wine. Rechercher la valeur de k donnant les meilleurs résultats. Préciser les
lignes de commande lancées, ainsi que le résultat obtenu.
Remarque : Les utilitaires du LVQ_PAK nécessitent un format de fichier un peu différent
(voir le fichier de données lvq_iris.dat, qui est bien formaté).