Mineure « Data Science » Frédéric Pennerath
Chapitre 3
DOCUMENTS SEMI-STRUCTURÉS
ET BASES DE DONNEES NOSQL
Mineure « Data Science » Frédéric Pennerath
Rappel sur les données structurées et
les bases relationnelles
Données structurées ou tables :
Liste de n-uplets à champs nommés et typés selon
un schéma fixe
Base de données relationnelles
Ensemble de tables et leurs schémas
Remarques :
Chaque table a une clé primaire (pas de
doublons)
Langage de requête SQL fondé sur
l’algèbre relationnelle : sélection,
projection, jointure
Optimisation des requêtes : index (B-tree),
optimiseur de plans d’exécution, cache
mémoire
Données utilisées après jointure par les
méthodes de machine learning (Weka,
scikit-learn)
Réf.
Client
Article
Quantité
1
1
1
4
2
2
2
400
Transactions
Réf.
Nom
Caté
-
gorie
Stock
1
Raquette
Master 300
exp
40
2
Raquette
First Smash
deb
2000
Articles
Mineure « Data Science » Frédéric Pennerath
Les différents types de base de données
NoSQL (not only SQL)
Base de données
Produits
Bases
de données
relationnelles (SQL)
MySQL,
PostgreSQL,
SQLite
, Oracle,
type objets
Bases
de données
orientées objet
Idem
+ surcouche
(
Hibernate, etc)
Bases de données
orientées colonnes
BigTable
(Google),
HBase
(Apache), Cassandra
(Apache),
Hypertable,
«
Pandas », etc
-structurées
Bases de données
orientées
documents
MongoDB
,
CouchDB
, etc
Bases de données
orientées
graphes
Entrepôts RDF (Allegro),
Neo4j, Oracle,
IBM, etc
Bases de données NoSQL
Mineure « Data Science » Frédéric Pennerath
Equivalence entre bases de données orientée objets
et relationnelles
Bases de données
orientées objet
Bases de données
relationnelles
Classe
Table
Attributs
typés d’une classe
Schéma d’une table
Adresse des objets
Clé primaire
Référence sur un objet
Clé étrangère
Méthodes des objets
Procédures stockées
Mineure « Data Science » Frédéric Pennerath
Données semi-structurées
livre
date
1668
chapitre
titre
La Cigale
et la
Fourmi
titre
Livre I
des fables
de la
Fontaine La Cigale
ayant
chantée
tout l’été
chapitre
titre
Le
Corbeau
et le
Renard
Maître
Corbeau
sur un
arbre
perché
Données semi-structurées :
Données de type arbre dont les nœuds peuvent être nommés et où les
feuilles sont des valeurs (entiers, chaînes de caractère, etc)
Adaptées aux documents : documents, pages Web, etc
1 / 22 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !