Quels choix de base de
données pour vos projets
Big Data ?
Big Data ?
Le terme "big data" est très à la mode et naturellement un terme si générique
est galvaudé. Beaucoup de promesses sont faites, et l'enthousiasme pour la
nouveauté technologique et pour les nouvelles opportunités qui s'ensuivent
tendent à faire passer les éventuelles limitations et contraintes au second
plan. Quand on gratte un peu, beaucoup de technologies prometteuses
viennent avec des limitations qu'on aurait tort d'ignorer.
Cette présentation proposera une vue pratique du domaine du big data, en
définissant le problème et en présentant d'une manière succincte les
solutions existantes avec leurs qualités et leurs défauts.
Avant tout, il faudra trouver une définition pour le "big data". Car en définitive,
quand peut-on réellement parler de big data? Quand on parle de téraoctets,
de peta-octets, d'exa-octets? Ou est-ce que certains projets de la taille du
gigaoctet peuvent être qualifiés de "big data"? Et au fond, est-ce que la taille
des données est le seul critère important? Est-ce même réellement un critère
majeur?
Quels usages pour les données
Une question fondamentale est "que faire avec les données massives".
Il ne s'agit pas simplement de se dire "nous avons beaucoup de
données, faisons du big data".
Plus sérieusement, beaucoup de projets big data ou pas sont
lancés sans avoir une vision claire d'où on veut arriver.
L'usage qu'on veut faire des données est une décision fondamentale
pour lancer un projet big data.
A quel niveau de complexité les données Big Data
peuvent-elles prétendre?
Quoi qu'on en dise, il y a toujours un problème d'échelle. La technologie est
encore loin de pouvoir résoudre des problèmes à la fois de complexité et de
taille quelconques.
Le "big data" a ses limites, on pourrait presque parler d'un "principe d'incertitude
d'Heisenberg": plus on a de données, plus la complexité de leur structure et du
traitement qu'on en fait sera limitée en pratique.
Les ordinateurs quantiques promettent de résoudre cette difficulté, mais on
n'est pas encore tout-à-fait prêts à les trouver dans un Apple store…
Le Big Data est il pertinent et / ou réalisable pour
types d’applications
La technologie impose actuellement une série de limitations pratiques aux
solutions big data. Les solutions big data sont rarement entièrement
transactionnelles au sens où on l'entend dans les bases de données disons
"traditionnelles" (c'est-à-dire applicatives).
Les bases de données applicatives restent pour l'instant le paradigme majeur en
informatique (ERP, applications de comptabilité, applications spécifiques dans
divers domaines…) Une base de données à transaction reportée n'est tout
simplement pas envisageable dans un environnement applicatif traditionnel (qu'il
soit client-serveur ou multi-tiers).
Un autre problème typique est celui de la complexité des schémas de données.
Pour un traitement efficace, la complexité (càd par exemple l'intégrité référentielle)
limite la taille des données pouvant être traitées en pratique.
Ces points et d'autres ne posent pas de difficultés pour certains types de
problèmes typiquement traités par les projets big data mais empêchent ces
solutions de prétendre à l'universalité.
1 / 18 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !