Ecole d’été STIC 2008
Sousse, 14 - 18 juillet 2008
******************************************************
Programme du Thème 2 :
******************************************************
Cours 2.1 : du lundi 14 au Jeudi 17/07/2008
Apprentissage et traitement de données numériques
Conférenciers :
Frederic Alexandre Hervé Frezza Buet Laurent Bougrain
----------------------------------------
Cours : L'inférence inductive sur des données numériques
Nous commencerons par situer le cours en présentant les différentes formes d'apprentissage
automatique (inférence inductive, déductive, abductive, apprentissage par coeur), les tâches à
apprendre (segmentation, visualisation, compression, régression, discrimination, association)
et les méthodes de modélisation (apprentissage non supervisé, supervisé, apprentissage par
renforcement, classification à une classe).
Cours : Le processus d'extraction de connaissance
Les méthodes d'apprentissage automatique ne constituent qu'une étape du processus
d'extraction de connaissance. La phase en amont de préparation des données (sélection,
transformations, recodages) et en aval d'analyse des résultats (matrice de confusion, intervalle
de confiance, faux positifs) seront détaillées.
Cours : Performances en généralisation
Le modèle obtenu à partir d'un échantillon de données est-il valable pour de nouvelles
données ? Nous aborderons des notions théoriques de l'apprentissage statistique (risque réel,
risque empirique, biais ou décomposition biais-variance, principes de minimisation du risque
empirique, bornes) et des techniques pratiques pour évaluer et améliorer les performances en
généralisation (validation croisée, Monte-Carlo, régularisation)
cours : Modèles linaires
Nous commencerons notre présentation des méthodes de modélisation par des méthodes
linéaires (classifieur naïf de Bayes, Algorithme de Ho-Kashap, séparation linéaire, descente
de gradient)
cours : Arbres de décision (pour la discrimination ou la régression)
-------------------------------------------------
Cours : Les méthodes de quantification vectorielle
principe (mesure de distorsion etc.), cellules de Voronoï, diagramme de Delaunay.
Algorithme de Llyod, des centres mobiles. Notion de conservation de topologie : Cartes auto-
organisatrices de Kohonen, neural gas, growing neural gas.
TP : Les réseaux connexionnistes supervisés