cm-sgbd-nosql

Telechargé par LIBAN HASSAN
MIF4 - SGBD non-relationnels
Fabien Duchateau
fabien.duchateau [at] univ-lyon1.fr
Université Claude Bernard Lyon 1
2018 - 2019
http://liris.cnrs.fr/ecoquery/dokuwiki/enseignement:mif04
Contexte
Depuis les années 1970, dominance du modèle relationnel
Émergence du web et du phénomène ”Big Data” :
IGrandes plateformes ou applications web gérant des millions
d’utilisatrices
IExplosion du volume de données à stocker et à traiter
IDonnées de plus en plus complexes et hétérogènes
Limites des SGBD relationnels (utilisant le langage SQL) pour ces
nouveaux usages, à cause du mécanisme de jointures, des
contraintes d’intégrité et des transactions
MIF4 - Gestion de données pour le web // SGBD non-relationnels UCBL Lyon 1 2 / 65
Contexte
Depuis les années 1970, dominance du modèle relationnel
Émergence du web et du phénomène ”Big Data” :
IGrandes plateformes ou applications web gérant des millions
d’utilisatrices
IExplosion du volume de données à stocker et à traiter
IDonnées de plus en plus complexes et hétérogènes
Limites des SGBD relationnels (utilisant le langage SQL) pour ces
nouveaux usages, à cause du mécanisme de jointures, des
contraintes d’intégrité et des transactions
MIF4 - Gestion de données pour le web // SGBD non-relationnels UCBL Lyon 1 2 / 65
Le Big Data
Big Data: modélisation, stockage et traitement (analyse) d’un
ensemble de données très volumineuses, croissantes et hétérogènes,
dont l’exploitation permet entre autre :
IPrise de décisions, prédiction
IDécouverte de nouvelles connaissances
IPossibilités de nouveaux ”business models” (e.g., accès à un
service contre des informations)
Causes :
IFaible coût du stockage
IFaible coût des processeurs
IMise à disposition des données
MIF4 - Gestion de données pour le web // SGBD non-relationnels UCBL Lyon 1 3 / 65
Le Big Data (2)
Les ”3V”, caractéristiques du Big Data :
IVolume (plusieurs zettaoctets générés par an sur le web)
IVélocité (fréquence de génération des données)
Inotion de ux (stream)
I4000 To par jour pour Facebook (2014)
I7000 To par seconde prévus pour le radiotélescope ”Square
Kilometre Array” (2020)
IVariété (hétérogénéité)
Idonnées brutes, structurées ou pas, etc.
Iimages, texte, géo-démographiques, prols utilisatrices, etc.
http://fr.wikipedia.org/wiki/Big_data
http://fr.wikipedia.org/wiki/Zettaoctet
MIF4 - Gestion de données pour le web // SGBD non-relationnels UCBL Lyon 1 4 / 65
1 / 89 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!