Diapos - gouno

21/11/2014 Big Data – IIe Rencontres STAT. à l’UBS –S.Tufféry 1

Le Big Data :

Aspects théoriques et pratiques

Stéphane TUFFERY

IIèmes Rencontres STAT.

à l’UBS

21 novembre 2014

21/11/2014 Big Data – IIe Rencontres STAT. à l’UBS –S.Tufféry 2

Plan

Le Big Data

Méthodes statistiques et Machine Learning pour le Big

Data

Réduction de la complexité et agrégation de modèles

Les réseaux sociaux

Exemple d’analyse d’un réseau social avec R

Conclusion

21/11/2014 Big Data – IIe Rencontres STAT. à l’UBS –S.Tufféry 3

Le Big Data

21/11/2014 Big Data – IIe Rencontres STAT. à l’UBS –S.Tufféry 4

Avant 1950 : la statistique avec quelques centaines d’individus et

quelques variables, recueillies dans un laboratoire selon un

protocole strict pour une étude scientifique

Années 1960-1980 : l’analyse des données avec quelques

dizaines de milliers d’individus et quelques dizaines de variables,

recueillies de façon rigoureuse pour une enquête précise

Années 1980-2000 : le data mining avec plusieurs millions

d’individus et plusieurs centaines de variables hétérogènes,

recueillies dans le système d’information des entreprises pour

de l’aide à la décision

À partir des années 2010 : le Big Data avec plusieurs centaines

de millions d’individus et plusieurs milliers de variables, de tous

types, recueillies dans les entreprises, les systèmes, Internet,

pour de l’aide à la décision, de nouveaux services

L’escalade de la puissance

21/11/2014 Big Data – IIe Rencontres STAT. à l’UBS –S.Tufféry 5

Données signalétiques et sociodémographiques

Données de comportement (utilisation du téléphone, de la carte

bancaire, du véhicule…)

Données CRM (contact avec un service client, carte de fidélité,

fidélisation…)

Données externes provenant des administrations (Open Data) ou des

mégabases de données privées

Informations remontées par les capteurs industriels, routiers,

climatiques, puces RFID, NFC, objets connectés (caméras, compteurs

électriques, appareils médicaux, voitures…)

Géolocalisation par GPS ou adresse IP

Données de tracking sur Internet (sites visités, mots-clés

recherchés...)

Contenu partagé sur Internet (blogs, photos, vidéos…)

Opinions exprimées dans les réseaux sociaux (sur une entreprise, une

marque, un produit, un service…)

L’explosion de la production de données

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

Diapos - gouno

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Diapos - gouno

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib