Programme de l`option Ingénierie d`Aide à la Décision

Téléchargement

Programme de l’option Ingénierie d’Aide à la Décision

(IAD)

Responsable : Maria Malek

18 octobre 2013

1 Objectif

Deux domaines sont explorés dans cette option :

La fouille des données (Data Mining) :

– Découvrir les informations intéressantes, utiles dans les très grandes bases de données.

– Utiliser les outils mathématiques puissants pour construire des algorithmes très perfor-

mants.

La recherche opérationnelle :

– Traiter des problèmes d’optimisation, d’aide à la décision et d’évaluation de performances

liées aux organisations et procédés du monde réel.

– Domaines : transports, télécommunications, systèmes de production, procédés industriels

2 Module exploration et fouille des données - 218h

– Apprentissage automatique et fouille de données : approche applicative - 30h.

– Méthodes et outils pour le "Big Data" - 20h.

– Web Mining - 20h.

– Analyse des réseaux sociaux - 40h.

– SAS Entreprise Miner- 24h.

– Analyse de données approfondie - 15h.

– Modèles de prévision - 24h.

– Text Mining - 30h.

– Vie Artiﬁcielle - 15h.

3 Module Recherche Opérationnelle - 127h

– Programmation par contraintes - 33h.

– Théorie de la complexité - 15h.

– SAS/OR Recherche opérationnelle - 24h.

– Optimisation multi-objective - 15h.

– Recherche Opérationnelle et métiers - 40h.

4 modules complémentaires - 90h

– Python - 20h.

– Web sémantique et Ontologies - 20h.

– Introduction à l’informatique décisionnelle - 30h.

– Web des données et du temps réel - 20h.

5 Les projets de l’option - 340h

– Projet d’entreprise - 140h,

– Projet de ﬁn d’études - 200h.

6 Contenu des cours

6.1 Module Exploration et fouille des Données

6.1.1 Apprentissage automatique et Fouille de données : approche applicative

Enseignant Maria Malek

Objectif Le cours de fouille de données permet aux étudiants d’avoir une approche approfondie

de la problématique et des applications de la fouille de données. Il permet également d’étudier

plusieurs modèles ainsi que leurs applicabilités sur diﬀérents types de données. Les travaux pra-

tiques se font sur Weka. Ce cours est composé de deux parties, une partie théorique et une

partie applicative. La partie théorique permet dans un premier temps de voir les méthodes et les

techniques d’apprentissage symboliques, statistiques et connexionnistes. Une Introduction à la

problématique de "Big Data" et la fouille des données parallèles est ensuite présentée. La libraire

Mahout et le framework MapReduce sont utilisées.

Contenu

1. Apprentissage supervisé ou non supervisé. Notions de précision et de rappel, erreur appa-

rente, matrice de confusion et validation croisée.

2. Méthodes & techniques d’apprentissage automatique supervisé

(a) Les modèles SVM et les modèles neuronaux.

(b) Les arbres de décisions. Les algorithmes ID3, C4.5, Cart.

(d) Les règles d’associations : algorithmes apriori et aprioriTid. Génération des règles

d’associations.

RÉFÉRENCES

3. Le classiﬁeur bayésien naïf.

4. Les réseaux bayésiens

(a) Inférences descendante et ascendante.

(b) Loi du réseau bayésien.

(d) Problèmes de prédiction et de diagnostic.

5. Méthodes de discrétisation et de sélection des variables

6. Implémentation parallèle de certains algorithmes avec le Framework MapReduce : K-means,

FPGrowth, etc.

Références

[1] Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy Advances in Knowledge Disco-

very and Data Mining. AAAI/MIT Press, 1996.

[2] Ian H. Witten ; Eibe Frank Data Mining : Practical machine learning tools and techniques,

2nd Edition.. Morgan Kaufmann, 2005.

[3] Sean Owen, Robin Anil, Ted Dunning, and Ellen Friedman Mahout in Action. Manning

Publications, 1 edition, January 2011.

6.1.2 Web Mining

Enseignant Maria Malek

Objectif Le but de ce cours est d’introduire la problématique du web mining ainsi que son

utilisation dans les méthodes de personnalisation, de découverte du proﬁl utilisateur ainsi que

le ﬁltrage collaboratif. Il s’agit d’étudier les méthodes et les techniques de fouille des données

appliquées au web. Trois types de données sont étudiés : la structure du web, les comportements

des internautes ainsi que le contenu des pages.

Contenu

1. Représentation et modélisation des données web : le contenu, la structure et le comporte-

ment.

– Représentation du contenu des pages webs.

– Modélisation des sessions de navigations.

– Représentation de la structure hyper-média du web.

2. Techniques d’exploration des diﬀérents types de données et d’actions utilisateurs.

– Algorithmes d’apprentissage non supervisés : classiﬁcation hiérarchique ascendante, centres

mobiles, règles d’association, etc.

– Algorithme d’apprentissage supervisé : arbre de décision, réseaux de neurones raisonne-

ment à partir de cas, etc.

RÉFÉRENCES

3. Applications du web mining : Détection de proﬁl, prédiction & recommendation personna-

lisation, adaptation des sites web et ﬁltrage collaborative.

Références

[1] Bing Liu Web Data Mining,Exploring Hyperlinks, Contents, and Usage Data.. Springer, 2007.

6.1.3 Analyse de réseaux sociaux

Enseignant Rushed Kanawati / LIPN-Université Paris13

Objectif Dans de nombreux contextes variés des graphes sont employées pour modéliser des

systèmes d’interactions complexes ; nous les manipulons aujourd’hui fréquemment au sein de

réseaux biologiques, de réseaux sociaux, de graphes de modélisation du web, de graphes d’échanges

pair-à-pair par exemple. Ces graphes ont généralement des propriétés non triviales communes qui

les distinguent des graphes aléatoires. L’objectif de ce cours est d’introduire les problématiques

et les techniques d’analyse et de fouille de ce type de graphes. Nous nous appuyons sur le langage

Python et la bibliothèque NetworkX1.

Contenu

1. Fondements : Acteurs, Relations, Représentation par graphes et/ou matrices.

2. Exemple : le petit monde, les communautés sur internet, etc.

3. Calculs en analyse de réseaux sociaux :

– Centralité de degré, Centralité d’intermédiarité, Centralité de Proximité.

– Centralité de prestige, Centralisation de pouvoir.

– Clustering coeﬃcient, Degré de cohésion, Degré de densité.

– Longueur du chemin, Radiality, Reach.

– Équivalence structurale, Trou structural, Multiplexité.

4. Identiﬁcation de communautés : déﬁnitions, problématiques, fonctions de qualité, classiﬁ-

cation des approches & applications : Mise en œuvre d’algorithmes séparatifs (Newman) et

agglomératifs (Louvain).

5. Nouvelles approches d’identiﬁcation de communautés : Algorithmique génétique, identiﬁ-

cations de meneurs. Mise en œuvre de diﬀérents algorithmes d’identiﬁcations de meneurs.

6. Identiﬁcation de communautés dans des graphes multipartites.

7. Problème de prévision de liens : Problématiques, problèmes similaires, approches. Tech-

niques d’apprentissage automatique supervisés et semi-supervisé pour la prévision de liens :

Recommandation de ﬁlms par prévision de liens dans un graphe bipartite : cas de MovieLens

8. Visualisation de grands graphe : Prise en main de l’outil igraph.

RÉFÉRENCES

Références

[1] C.C. Aggarwal Social Network Data Analysis. Springer Science and Business Media, 2011.

6.1.4 SAS : Entreprise Miner

Enseignant Richard Eudes /SAS.

Objectif Optimiser le ciblage Marketing, développer ces ventes, détecter les comportements

frauduleux. Les modèles prédictifs permettent de répondre à ces attentes. Ce cours présente

aux élèves comment implémenter et industrialiser ces modèles avec la méthodologie SEMMA du

logiciel SAS Enterprise MinerTM.

Contenu

1. Tour d’horizon du logiciel SAS R

⃝Enterprise MinerTM, Présentation des fonctionnalités,

Création d’un projet, Exploration graphique des données.

2. Analyse descriptive, Méthode de classiﬁcation, Analyse du proﬁl des segments ou classes,

Règles d’association.

3. Partitionnement de données.

4. Arbres de décision : construction des arbres, choix du meilleur arbre.

5. Comparaison des modèles candidats : choix du meilleur modèle.

6. Régression logistique : traitement des données manquantes, sélection de variables, régression

polynomiale.

7. Réseaux de neurones : introduction et utilisation.

8. Matrice de proﬁt, ajustement en cas de sur-échantillonnage

9. Scoring : application du modèle à de nouvelles données.

6.1.5 Modèles de prévisions

Enseignant Hervé De Milleville

Objectif L’objet de cette matière est l’étude d’une suite de valeurs numériques représentant

l’évolution d’une quantité au cours du temps (série temporelle ou chronologique). De telles suites

de valeurs peuvent être exprimées mathématiquement aﬁn d’en analyser le comportement, gé-

néralement pour comprendre son évolution passée et pour en prévoir le comportement futur

(prévision à court terme).

Contenu

1. Méthode de moyennes mobiles simples et doubles.

2. Méthode de lissage exponentiel simple et double.

3. Méthode de modèle de Holt et Winter.

1 / 12 100%

Documents connexes

La fouille des règles d`association est un processus qui permet de

Stage en Data Mining - Machine Learning Group

Systèmes Artificiels Complexes

Fiche-UE_CODE_CR_OPT_DM - LIRIS

Initiation à la science des données-data science

Algorithme sur les graphes en C++ (C. Labruère Chazal) Ce projet a

titre sur 1 ou 2 lignes maximum

catalogue de cours - Ascencia Business School

Data/Pattern Analysis

Stage Liesse 2017-1

Conférence-débat - Une éthique des algorithmes

Titre : Implémentation d`un algorithme de fouille de données

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Programme de l`option Ingénierie d`Aide à la Décision

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Programme de l`option Ingénierie d`Aide à la Décision

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib