Programme de l’option Ingénierie d’Aide à la Décision
(IAD)
Responsable : Maria Malek
18 octobre 2013
1 Objectif
Deux domaines sont explorés dans cette option :
La fouille des données (Data Mining) :
Découvrir les informations intéressantes, utiles dans les très grandes bases de données.
Utiliser les outils mathématiques puissants pour construire des algorithmes très perfor-
mants.
La recherche opérationnelle :
Traiter des problèmes d’optimisation, d’aide à la décision et d’évaluation de performances
liées aux organisations et procédés du monde réel.
Domaines : transports, télécommunications, systèmes de production, procédés industriels
2 Module exploration et fouille des données - 218h
Apprentissage automatique et fouille de données : approche applicative - 30h.
Méthodes et outils pour le "Big Data" - 20h.
Web Mining - 20h.
Analyse des réseaux sociaux - 40h.
SAS Entreprise Miner- 24h.
Analyse de données approfondie - 15h.
Modèles de prévision - 24h.
Text Mining - 30h.
Vie Artificielle - 15h.
3 Module Recherche Opérationnelle - 127h
Programmation par contraintes - 33h.
Théorie de la complexité - 15h.
SAS/OR Recherche opérationnelle - 24h.
1
Optimisation multi-objective - 15h.
Recherche Opérationnelle et métiers - 40h.
4 modules complémentaires - 90h
Python - 20h.
Web sémantique et Ontologies - 20h.
Introduction à l’informatique décisionnelle - 30h.
Web des données et du temps réel - 20h.
5 Les projets de l’option - 340h
Projet d’entreprise - 140h,
Projet de fin d’études - 200h.
6 Contenu des cours
6.1 Module Exploration et fouille des Données
6.1.1 Apprentissage automatique et Fouille de données : approche applicative
Enseignant Maria Malek
Objectif Le cours de fouille de données permet aux étudiants d’avoir une approche approfondie
de la problématique et des applications de la fouille de données. Il permet également d’étudier
plusieurs modèles ainsi que leurs applicabilités sur différents types de données. Les travaux pra-
tiques se font sur Weka. Ce cours est composé de deux parties, une partie théorique et une
partie applicative. La partie théorique permet dans un premier temps de voir les méthodes et les
techniques d’apprentissage symboliques, statistiques et connexionnistes. Une Introduction à la
problématique de "Big Data" et la fouille des données parallèles est ensuite présentée. La libraire
Mahout et le framework MapReduce sont utilisées.
Contenu
1. Apprentissage supervisé ou non supervisé. Notions de précision et de rappel, erreur appa-
rente, matrice de confusion et validation croisée.
2. Méthodes & techniques d’apprentissage automatique supervisé
(a) Les modèles SVM et les modèles neuronaux.
(b) Les arbres de décisions. Les algorithmes ID3, C4.5, Cart.
(c) l’algorithme foil & la résolution inverse,
(d) Les règles d’associations : algorithmes apriori et aprioriTid. Génération des règles
d’associations.
2
RÉFÉRENCES
3. Le classifieur bayésien naïf.
4. Les réseaux bayésiens
(a) Inférences descendante et ascendante.
(b) Loi du réseau bayésien.
(c) Structure de bases : linéaire, en V ou en chapeau.
(d) Problèmes de prédiction et de diagnostic.
5. Méthodes de discrétisation et de sélection des variables
6. Implémentation parallèle de certains algorithmes avec le Framework MapReduce : K-means,
FPGrowth, etc.
Références
[1] Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy Advances in Knowledge Disco-
very and Data Mining. AAAI/MIT Press, 1996.
[2] Ian H. Witten ; Eibe Frank Data Mining : Practical machine learning tools and techniques,
2nd Edition.. Morgan Kaufmann, 2005.
[3] Sean Owen, Robin Anil, Ted Dunning, and Ellen Friedman Mahout in Action. Manning
Publications, 1 edition, January 2011.
6.1.2 Web Mining
Enseignant Maria Malek
Objectif Le but de ce cours est d’introduire la problématique du web mining ainsi que son
utilisation dans les méthodes de personnalisation, de découverte du profil utilisateur ainsi que
le filtrage collaboratif. Il s’agit d’étudier les méthodes et les techniques de fouille des données
appliquées au web. Trois types de données sont étudiés : la structure du web, les comportements
des internautes ainsi que le contenu des pages.
Contenu
1. Représentation et modélisation des données web : le contenu, la structure et le comporte-
ment.
Représentation du contenu des pages webs.
Modélisation des sessions de navigations.
Représentation de la structure hyper-média du web.
2. Techniques d’exploration des différents types de données et d’actions utilisateurs.
Algorithmes d’apprentissage non supervisés : classification hiérarchique ascendante, centres
mobiles, règles d’association, etc.
Algorithme d’apprentissage supervisé : arbre de décision, réseaux de neurones raisonne-
ment à partir de cas, etc.
3
RÉFÉRENCES
3. Applications du web mining : Détection de profil, prédiction & recommendation personna-
lisation, adaptation des sites web et filtrage collaborative.
Références
[1] Bing Liu Web Data Mining,Exploring Hyperlinks, Contents, and Usage Data.. Springer, 2007.
6.1.3 Analyse de réseaux sociaux
Enseignant Rushed Kanawati / LIPN-Université Paris13
Objectif Dans de nombreux contextes variés des graphes sont employées pour modéliser des
systèmes d’interactions complexes ; nous les manipulons aujourd’hui fréquemment au sein de
réseaux biologiques, de réseaux sociaux, de graphes de modélisation du web, de graphes d’échanges
pair-à-pair par exemple. Ces graphes ont généralement des propriétés non triviales communes qui
les distinguent des graphes aléatoires. L’objectif de ce cours est d’introduire les problématiques
et les techniques d’analyse et de fouille de ce type de graphes. Nous nous appuyons sur le langage
Python et la bibliothèque NetworkX1.
Contenu
1. Fondements : Acteurs, Relations, Représentation par graphes et/ou matrices.
2. Exemple : le petit monde, les communautés sur internet, etc.
3. Calculs en analyse de réseaux sociaux :
Centralité de degré, Centralité d’intermédiarité, Centralité de Proximité.
Centralité de prestige, Centralisation de pouvoir.
Clustering coefficient, Degré de cohésion, Degré de densité.
Longueur du chemin, Radiality, Reach.
Équivalence structurale, Trou structural, Multiplexité.
4. Identification de communautés : définitions, problématiques, fonctions de qualité, classifi-
cation des approches & applications : Mise en œuvre d’algorithmes séparatifs (Newman) et
agglomératifs (Louvain).
5. Nouvelles approches d’identification de communautés : Algorithmique génétique, identifi-
cations de meneurs. Mise en œuvre de différents algorithmes d’identifications de meneurs.
6. Identification de communautés dans des graphes multipartites.
7. Problème de prévision de liens : Problématiques, problèmes similaires, approches. Tech-
niques d’apprentissage automatique supervisés et semi-supervisé pour la prévision de liens :
Recommandation de films par prévision de liens dans un graphe bipartite : cas de MovieLens
8. Visualisation de grands graphe : Prise en main de l’outil igraph.
4
RÉFÉRENCES
Références
[1] C.C. Aggarwal Social Network Data Analysis. Springer Science and Business Media, 2011.
6.1.4 SAS : Entreprise Miner
Enseignant Richard Eudes /SAS.
Objectif Optimiser le ciblage Marketing, développer ces ventes, détecter les comportements
frauduleux. Les modèles prédictifs permettent de répondre à ces attentes. Ce cours présente
aux élèves comment implémenter et industrialiser ces modèles avec la méthodologie SEMMA du
logiciel SAS Enterprise MinerTM.
Contenu
1. Tour d’horizon du logiciel SAS R
Enterprise MinerTM, Présentation des fonctionnalités,
Création d’un projet, Exploration graphique des données.
2. Analyse descriptive, Méthode de classification, Analyse du profil des segments ou classes,
Règles d’association.
3. Partitionnement de données.
4. Arbres de décision : construction des arbres, choix du meilleur arbre.
5. Comparaison des modèles candidats : choix du meilleur modèle.
6. Régression logistique : traitement des données manquantes, sélection de variables, régression
polynomiale.
7. Réseaux de neurones : introduction et utilisation.
8. Matrice de profit, ajustement en cas de sur-échantillonnage
9. Scoring : application du modèle à de nouvelles données.
6.1.5 Modèles de prévisions
Enseignant Hervé De Milleville
Objectif L’objet de cette matière est l’étude d’une suite de valeurs numériques représentant
l’évolution d’une quantité au cours du temps (série temporelle ou chronologique). De telles suites
de valeurs peuvent être exprimées mathématiquement afin d’en analyser le comportement, gé-
néralement pour comprendre son évolution passée et pour en prévoir le comportement futur
(prévision à court terme).
Contenu
1. Méthode de moyennes mobiles simples et doubles.
2. Méthode de lissage exponentiel simple et double.
3. Méthode de modèle de Holt et Winter.
5
1 / 12 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !