Examen Module Apprentissage et Fouille de

publicité
Examen
Module Apprentissage et Fouille de Données (ISI-03)
19 décembre 2014
(Partie à pouvoir préparer avant)
Le contrôle comporte deux parties, l’une portant plus particulièrement sur le cours d’apprentissage artificiel,
l’autre sur le cours de fouille de données. Afin de faciliter la correction, il vous est demandé de bien faire les deux
parties du contrôle sur des feuilles séparées.
– La partie suivante du contrôle porte sur l’apprentissage. −→ Vous pouvez répondre directement sur
cette feuille pour cette partie, les espaces blancs étant préparés à cet effet.
Attention il y a 9 questions (notées sur 20 points).
– N’oubliez pas de mettre votre nom (éventuellement dans une double feuille cachetée pour préserver l’anonymat).
1. (3 points) Vous allez réfléchir à des applications réelles de l’apprentissage artificiel.
(a) Décrivez une application relevant de la classification supervisée. Précisez les variables d’entrée et de
sortie. Dites d’où pourraient venir les exemples d’apprentissage.
(b) Décrivez une application relevant de la régression. Précisez les variables d’entrée et de sortie. Dites d’où
pourraient venir les exemples d’apprentissage.
(c) Décrivez une application relevant du clustering. Précisez les variables d’entrée. Dites d’où pourraient
venir les exemples d’apprentissage.
2. (2 points) Une question à découvrir le 19 décembre.
3. (2 points) Validation de l’apprentissage. Dites à quoi servent respectivement les ensemble d’apprentissage,
ensemble de test et ensemble de validation.
4. (2 points) Une question à découvrir le 19 décembre.
5. (1 point) Une question à découvrir le 19 décembre.
6. (1 point) Une question à découvrir le 19 décembre.
7. (2 points) Une question à découvrir le 19 décembre.
8. (3 points) Supposons que le fournisseur d’électricité veuille construire un système de prédiction de la consommation électrique pour les 5 jours à venir à un instant t. Les données disponibles sont les consommations
journalières pour les 5 dernières années. Cette consommation est typiquement comprise entre 80 et 400 MegaWattheure.
1
– Dites comment vous pourriez utiliser un Perceptron Multicouches pour réaliser ce système de prédiction.
Quelles seraient les entrées ? Si de plus, vous disposiez de la prédiction de la météo pour la journée suivante
(par exemple la température diurne et la température nocture), comment en tiendriez-vous compte dans le
système ?
– Pensez-vous que ce système pourrait être un bon prédicteur ? Existe-t-il des conditions pour lesquelles on
peut attendre des prédictions de mauvaise qualité ?
9. (4 points) En reprenant les notations du devoir à la maison No 1, on suppose que l’on considère un autre espace
d’hypothèses dans lequel les disjonctions de deux hypothèses au maximum sont autorisées, par exemple :
(soleil ∧ chaud ∧ ? ∧ f ort ∧ ? ∧ égale) ∨ (soleil ∧ chaud ∧ ? ∧ ? ∧ chaude ∧ change)
Soit la séquence d’exemples suivante :
Exemple
Ciel
AirTemp
Humidité
Vent
Eau
Prévision_lendemain
Classe
1
soleil
chaud
normale
fort
chaude
identique
‘+’
2
soleil
chaud
élevée
fort
chaude
identique
‘+’
3
pluie
froid
élevée
fort
chaude
change
‘−’
4
soleil
chaud
élevée
fort
froide
change
‘+’
Donnez le S_set et le G_set après la prise en compte de chacun de ces exemples.
2
Téléchargement