21/11/2014 Big Data – IIe Rencontres STAT. à l’UBS S.Tufféry 1
Le Big Data :
Aspects théoriques et pratiques
Stéphane TUFFERY
IIèmes Rencontres STAT.
à l’UBS
21 novembre 2014
21/11/2014 Big Data – IIe Rencontres STAT. à l’UBS S.Tufféry 2
Plan
Le Big Data
Méthodes statistiques et Machine Learning pour le Big
Data
Réduction de la complexité et agrégation de modèles
Les réseaux sociaux
Exemple d’analyse d’un réseau social avec R
Conclusion
21/11/2014 Big Data – IIe Rencontres STAT. à l’UBS S.Tufféry 3
Le Big Data
21/11/2014 Big Data – IIe Rencontres STAT. à l’UBS S.Tufféry 4
Avant 1950 : la statistique avec quelques centaines d’individus et
quelques variables, recueillies dans un laboratoire selon un
protocole strict pour une étude scientifique
Années 1960-1980 : l’analyse des données avec quelques
dizaines de milliers d’individus et quelques dizaines de variables,
recueillies de façon rigoureuse pour une enquête précise
Années 1980-2000 : le data mining avec plusieurs millions
d’individus et plusieurs centaines de variables hétérogènes,
recueillies dans le système d’information des entreprises pour
de l’aide à la décision
À partir des années 2010 : le Big Data avec plusieurs centaines
de millions d’individus et plusieurs milliers de variables, de tous
types, recueillies dans les entreprises, les systèmes, Internet,
pour de l’aide à la décision, de nouveaux services
L’escalade de la puissance
21/11/2014 Big Data – IIe Rencontres STAT. à l’UBS S.Tufféry 5
Données signalétiques et sociodémographiques
Données de comportement (utilisation du téléphone, de la carte
bancaire, du véhicule…)
Données CRM (contact avec un service client, carte de fidélité,
fidélisation…)
Données externes provenant des administrations (Open Data) ou des
mégabases de données privées
Informations remontées par les capteurs industriels, routiers,
climatiques, puces RFID, NFC, objets connectés (caméras, compteurs
électriques, appareils médicaux, voitures…)
Géolocalisation par GPS ou adresse IP
Données de tracking sur Internet (sites visités, mots-clés
recherchés...)
Contenu partagé sur Internet (blogs, photos, vidéos…)
Opinions exprimées dans les réseaux sociaux (sur une entreprise, une
marque, un produit, un service…)
L’explosion de la production de données
1 / 67 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !