Objectif :
Le cours de fouille de données permet aux étudiants :
1. d’avoir une première approche de la problématique et des
applications de la fouille de données.
2. d’étudier plusieurs modèles ainsi que leurs applicabilités sur
différents types de données.
Pré-requis : Analyse de données
Contenu
Problématique, domaines et applications de la fouille de données.
Nature des données et des attributs. Apprentissage supervisé ou
non supervisé. Systèmes classifieurs. Validation des classifieurs :
Notions de précision et de rappel, erreur apparente, matrice de
confusion et validation croisée.
Comparaison entre deux modèles supervisé et non supervisé : les
k plus proches voisins et les centres mobiles.
Les règles d’associations : algorithmes apriori et aprioriTid.
Génération des règles d’associations. Propriétés de redondance
simple et stricte.
Les arbres de décisions. Les algorithmes ID3 et C4.5.
Le classifieur bayésien naïf.
Les réseaux bayésiens. Inférences descendante et ascendante.
Loi du réseau byésien. Structure de bases : linéaire, en V ou en
chapeau. Problèmes de prédiction et de diagnostic.
Comparaison et bilan des méthodes étudiées via une étude de
cas.
Validation
Contrôle continu.
Bibliographies
U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy.
Advances in Knowledge Discovery and Data Mining,. AAAI/MIT
Press, 1996.
Ian H. Witten; Eibe Frank Data Mining: Practical machine learning
tools and techniques, 2nd Edition. Morgan Kaufmann, 2005.
Intelligence Artificielle
Niveau : ING2 – Spécialité Mathématiques – Orientation IAD