Fiche d’exercices #2
Quelques méthodes génératives
Exercice 1 : Analyse discriminante
1. Apprendre le classifieur de l’analyse discriminante quadratique sur le jeu de données d’apprentissage
simulées lors du premier TP.
2. Quelle est la frontière de décision ?
3. Calculer le taux d’erreur sur le jeu de données de test et le comparer à l’erreur optimale obtenue par
la règle de Bayes.
4. Faire de même pour l’analyse discriminante linéaire. Comparer la frontière de décision estimée à la
frontière linéaire théorique choisie pour simuler le jeu de données.
5. Comparer les erreurs de test obtenues par les algorithmes suivants : moindres carrés pour la classifica-
tion, kplus proches voisins, analyse discriminante linéaire, analyse discriminante quadratique.
Exercice 2 : Bayésien naïf
1. Utiliser le script creator.R pour générer un premier jeu de données (Xi, Yi)1≤i≤noù Xi∈ {0,1}3et
Yi∈ {0,1}.
2. Scinder ce jeu de données en deux parties : sous-ensemble d’apprentissage et sous-ensemble de test.
Mettre en place le classifieur bayésien naïf sur l’ensemble d’apprentissage et calculer l’erreur sur le jeu
de données de test.
3. Faire de même pour le deuxième jeu de données. (Il y a alors deux variables à prédire : Yet Z.)
4. Comparer avec la méthode des kplus proches voisins.
Exercice 3 : Reconnaissance de voyelles
On cherche à définir un algorithme de reconnaissance automatique de 11 voyelles anglaises. L’ensemble
d’apprentissage contient 528 données obtenues par enregistrement audio. Après traitement numérique du
signal, chaque son est représenté par un vecteur de dimension 10.
1. Charger le jeu de données d’apprentissage. Apprendre le classifieur de l’analyse discriminante quadra-
tique sur cet ensemble de données.
2. Calculer le taux d’erreur sur le jeu de données de test.
3. Faire de même avec l’analyse discriminante linéaire. Comparer les résultats obtenus.
4. Comparer avec la méthode des kplus proches voisins.
1