
Projet de Sciences Humaines – 3ème année Génie Mathématiques
Big Brother du XXIème siècle : le ciblage commercial
Note de Synthèse
Introduction
Vous décidez de réserver un billet d’avion pour New-York sur Internet. Deux jours
plus tard, en lisant votre quotidien en ligne, une publicité vous propose une offre
intéressante pour une location de voitures New York. Ce n’est pas une simple coïncidence :
il s’agit d’un mécanisme de publicité ciblée, comme il s’en développe actuellement de plus
en plus sur Internet.
I. Définition et objectifs
a) Big Data
Les vagues technologiques qui se sont succédé au cours de ces trente dernières
années ont joué un rôle déterminant dans l’amélioration des systèmes d’information.
Une émergence des technologies mobiles : Smartphones, tablettes ainsi que l’essor
des réseaux sociaux (Facebook, Twitter, LinkedIn). Il y a également une nouvelle
technologie : le cloud, cette informatique « dans les nuages » permet l’utilisation de la
mémoire, des capacités de calcul des serveurs répartis dans le monde entier.
Tout ceci donne des informations qui sont déduites d’un ensemble de données. Les
données sont donc des éléments porteurs d’information.
L’explosion du volume de données expliquées par l’ensemble des nouvelles
technologies est l’origine du concept Big Data. Cette expression « Big Data » peut être
définie pour un énorme volume de données structurées ou non structurées, difficilement
gérables avec des solutions classiques de stockage et de traitement.
Une autre caractérisation du Big Data est celle des 3V : Volume, variété et vélocité.
Tout d’abord il y a un nombre inimaginable de données traiter (l’unité de mesure
est de l’ordre de l’exaoctet
). On peut regarder ce tableau pour nous faire comprendre
l’importance de ce « volume » :
Exaoctet : Unité de mesure de quantité d’information numérique, valant 1018 octets