Data Mining - Introduction Objectifs Le Data Mining apporte des solutions pour l’extraction de connaissances à partir de données brutes. Ces données représentent des volumes de plus en plus importants et font partie intégrante du patrimoine de l’entreprise. Comment exploiter au mieux ce gisement ? Quelles techniques utiliser pour identifier les corrélations pertinentes entre les données ? Comment gérer un projet de cette nature ? Ce séminaire, qui allie principes théoriques et expériences pratiques, vous propose une synthèse claire et précise sur le Data Mining, ses applications, ses apports pour l’entreprise, ainsi que sur les méthodes et outils les plus utilisés. Public Responsables infocentre, responsables marketing, statisticiens, responsables informatiques, chefs de projets décisionnel, experts décisionnel. Utilisateurs et gestionnaires métiers de bases de données. Prérequis Connaissance de base en analyse décisionnelle. Connaissances générales en informatique. Introduction au Data Mining (DM) Comprendre le Data Mining - Définition et finalité du Data Mining - Lien entre le DM et les statistiques - Différence entre le DM et OLAP - Historique du DM et travaux de recherche. - Les attentes des entreprises, les réponses du DM. Les techniques du Data Mining - Différentes familles du DM. - Méthodes prédictives et les méthodes descriptives. - L’analyse factorielle, l’analyse typologique, la classification ou clustering, la détection de liens. - Les arbres de décisions, les réseaux de neurones, les modèles paramétriques. - Classification des techniques de DM Présentation de méthodes La méthode descriptive du clustering - Définition et méthodologie. - Critères pour structurer les données à classer - Utilisation de variables. - Évaluation et validation des classes obtenues - Sous famille du clustering. - Exemple d’application du clustering Le Scoring : un premier exemple d’application du DM - Définition - Domaines d’activité / type de problèmes / finalité - Catégories de Scoring (appétence, risque, octroi). - Méthodologie de Scoring. - Cas pratique de Scoring Le géomarketing : un deuxième exemple d’application du DM - Domaines d’application - Cas pratique de géomarketing Mise en place d’une solution Les données de l’entreprise : entre qualité et quantité ? -Problématique des données du SI. - Types de données. - Qualité des données et administration des données. - Processus de collecte et d’exploration. - Création d’agrégats et de nouvelles données. - Transformation des données. Méthodologie de projet - Définition du problème métier à résoudre et des objectifs à atteindre. - Inventaire, description et classement des données. - Conception et alimentation de la base Data Mining. - Exploration, segmentation des entités analysées. - Établissement du ou des modèles d’analyse. - Application des modèles et validation des résultats. - Itérations, déploiement auprès des utilisateurs (formation, accompagnement du changement...). - Maintenance du modèle et logiciel associé. Panorama des outils - Les principaux outils : SAS, R, IBM SPSS, Oracle Data Mining, SQL Server DM... - Quels critères de choix pour ce type d’outils ? Toutes nos formations sur http://www.esic-online.com Décisionnel 2 jours Fondamentaux du Système d’information Décisionnel (SID) - Les enjeux du SID - Architecture type d’un SID, état de l’art en matière d’architectures décisionnelles. - Les différentes couches du SID - Élaboration des informations décisionnelles, présentation. - Conception d’un SID - Panorama des outils décisionnels. Page 1/1