11/12/2015 © Stéphane Tufféry - Usage réservé à l’UCO 1
DATA MINING ET BIG DATA
Stéphane TUFFERY
Université Catholique de l’Ouest
Institut de Mathématiques Appliquées
11 décembre 2015
11/12/2015 © Stéphane Tufféry - Usage réservé à l’UCO 2
Présentation de l’intervenant
Responsable de l’équipe statistique dans un grand groupe
bancaire français
Enseigne à l’Université Rennes 1 et à l’ENSAI
Docteur en Mathématiques
Auteur de :
Data Mining et Statistique Décisionnelle, Éditions
Technip, 2005, 4eédition 2012, préface de
Gilbert Saporta
Data Mining and Statistics for Decision Making,
Éditions Wiley, mars 2011
Étude de cas en Statistique Décisionnelle,
Éditions Technip, 2009
Computational Actuarial Science with R (ouvrage
collectif), Éditions Chapman & Hall, 2014
Modélisation prédictive et apprentissage
statistique avec R, Éditions Technip, 2015
11/12/2015 © Stéphane Tufféry - Usage réservé à l’UCO 3
Plan
Qu’est-ce que le data mining ?
Qu’est-ce que le Big Data ?
À quoi sert le data mining ?
À quoi sert le Big Data ?
Exemple d’analyse d’un réseau social avec R
L’élaboration d’un modèle de scoring
------------------------------------------------------------------------------------------------------------
La sélection des variables
La modélisation
Réduction de la complexité et agrégation de modèles
Méthodes pour le Big Data
Analyses en grande dimension : comparaison de logiciels
Conclusion
11/12/2015 © Stéphane Tufféry - Usage réservé à l’UCO 4
Qu’est-ce que le data mining ?
11/12/2015 © Stéphane Tufféry - Usage réservé à l’UCO 5
La fouille de données
Le data mining est l’ensemble des :
méthodes scientifiques
… destinées à l’exploration et l’analyse
… de (souvent) grandes bases de données informatiques
… en vue de détecter dans ces données des profils-type, des
comportements récurrents, des règles, des liens, des tendances
inconnues (non fixées a priori), des structures particulières restituant
de façon concise l’essentiel de l’information utile
… pour l’aide à la décision
On parle d’extraire l’information de la donnée
Selon le MIT, c’est l’une des 10 technologies émergentes qui
« changeront le monde » au XXIesiècle
Selon Hal Varian, Chief Economist de Google : “I keep saying
that the sexy job in the next 10 years will be statisticians”
1 / 159 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !