1
Masters Spécialisés
« Actuariat et Prévoyance » et
« Actuariat et Finance »
Introduction au Data Mining
K. EL HIMDI
elhimdi@menara.ma
Sommaire du MODULE
Partie 1 : Introduction au Data Mining
Partie 2 : Présentation de la plate-forme de
Data Mining PASW Modeler
Partie 3 : Ateliers de manipulation de base de
PASW Modeler
2
3
Partie 1 : Introduction au Data
Mining
1- Qu’est ce que le Data Mining ?
2- Domaines d’applications
3- Principales techniques
3.1 Techniques non supervisées
3.2 Techniques supervisées
4- Méthodologie de Projets
4
Contexte économique
Les entreprises doivent améliorer
La qualité des produits & services
La connaissance des marchés et leur dynamique
Leur position face à la concurrence
Les coûts de production
La connaissance des technologies pour en tirer profit
La maîtrise de l’information par un processus d’intelligence
La collecte de l’information,
Le traitement de l’information,
La diffusion de l’information à des fins stratégiques
D’où l’importance du « Data Mining»
5
Actions
Plate-forme analytique et
opérationnelle pour l’entreprise
Vision Client Unique
Analyses Data mining Statistiques
Intégration des canaux de communication et des processus métiers
Données opérationnellesCall Center
Datamart Marketing Données déclaratives Données contrats Navigation Web
Direction Générale :
Analyses et Reporting
Sortantes Entrantes
Acquisition client, ventes
croisées et rétention
Optimisation des
campagnes Marketing
Segmentation Client
Valeur
Comportement
Simulation tarifaire
Optimisation des
interactions Web
Marketing
Analyse du portefeuille
client
Ventes croisées et
rétention sur le point de
contact du client
Affectation des prospects
aux commerciaux
Analyse de la performance
Force de vente
Secteurs
géographiques
Ventes
Credit Scoring
Notation Interne & Risque
(ex. Bâle II, Patriot Act)
Optimisation des grilles
tarifaires
Valorisation des sinistres
Détection de Fraude
(sinistres, cartes, prêt)
Blanchiment d’Argent
Finances
Service Client pro-actif
Call center monitoring et
tuning
Analyse automatique des
emails
Satisfaction Client
Recrutement des employés
Satisfaction des employés
Rétention des employés
Organisation
6
Analyse Historique (BI) Analyse Prédictive (DM)
De l’analyse historique à
l’analyse Predictive
Valeur Business
Temps
Que devons
nous offrir à
ce client
aujourd’hui?
Real time
distribution
Quels
Quels clients
clients
type
type sont
sont à
à
risques
risques et
et
pourquoi
pourquoi?
?
Data
mining
Quelle
Quelle est
est
leur
leur
localisation
localisation?
?
OLAP
Combien
Combien de
de
clients
clients avons
avons
nous
nous perdu
perdu?
?
Query &
Reporting
Point de départ de la chaîne de prise de décision : le Reporting
Soucis pour les entreprises : données incompatibles, lourdeur du traitement,
difficultés de consolidations, ….
I. BERRADA
Intelligence
Artificielle,
Machine
Learning
Réseaux de neurones
Règles d’inductions
Kohonen
Statistiques
Régression logistique
Analyse discriminante
Arbre de décision : CHAID
Classification : K-Means
Data Mining
Database
Technology
ETL, ROLAP, MOLAP
Reporting
Le Data Mining : Un champs
multidisciplinaire
Prédictive – prédit une valeur
numérique ou symbolique
Classement (Segmentation ou
Clustering) – Identifier des
groupes d’items ayant un
comportement similaire.
Association –trouver des
événements ayant une forte
probabilité de se réaliser
ensemble
Familles d’algorithmes
7
8
Qu’est ce que le Data Mining?
1
9
Qu’est ce que le Data Mining ?
Data Mining est un sujet qui dépasse le cercle restreint des
scientifiques et suscite un vif intérêt dans le monde des
affaires
«l’extraction d’information originale, auparavant
inconnues et potentiellement utiles, à partir de données
» (Piateski-Shapiro).
«la découverte de nouvelles corrélation (ou coefficient
de coïncidence), tendances et modèles par tamisage
d’un large volume de données» (John Page).
«un processus d’aide à la décision où les utilisateurs
cherchent des modèles d’interprétation dans les
données» (Kamran Parsaye).
10
«l’exploration et l’analyse, par des moyens
automatiques ou semi-automatiques, d’un large volume
de données afin de découvrir des tendances ou des
règles» (M. Berry).
«un processus non élémentaire de mise à jour de
relation, corrélation, dépendances, association,
modèles, structure, tendance, classes, facteurs obtenus
en naviguant à travers de grands ensembles de
données» (M. Jambu).
Avec poésie: « …torturer l’information disponible
jusqu’à ce qu’elle avoue …» (Dimitris Chorafas).
Avec cynisme et réalisme «… passer les données dans
la machine à saucisses pour obtenir des Merguez …
douces ou épicées …» (Moktar Outtas)
Qu’est ce que le Data Mining ?
1 / 37 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !