DOCUMENTS SEMI-STRUCTURÉS ET BASES DE DONNEES

Téléchargement

Mineure « Data Science » Frédéric Pennerath

Chapitre 3

DOCUMENTS SEMI-STRUCTURÉS

ET BASES DE DONNEES NOSQL

Mineure « Data Science » Frédéric Pennerath

Rappel sur les données structurées et

les bases relationnelles

Données structurées ou tables :

Liste de n-uplets à champs nommés et typés selon

un schéma fixe

Base de données relationnelles

Ensemble de tables et leurs schémas

Remarques :

•Chaque table a une clé primaire (pas de

doublons)

•Langage de requête SQL fondé sur

l’algèbre relationnelle : sélection,

projection, jointure

•Optimisation des requêtes : index (B-tree),

optimiseur de plans d’exécution, cache

mémoire

•Données utilisées après jointure par les

méthodes de machine learning (Weka,

scikit-learn)

Réf.

Client

Article

Quantité

400

…

Transactions

Réf.

Nom

Caté

gorie

Stock

Raquette

Master 300

exp

Raquette

First Smash

deb

2000

…

Articles

Mineure « Data Science » Frédéric Pennerath

Les différents types de base de données

NoSQL (not only SQL)

Type de données

Base de données

Produits

Données structurées typées

Bases

de données

relationnelles (SQL)

MySQL,

PostgreSQL,

SQLite

, Oracle, …

Données de

type objets

Bases

de données

orientées objet

Idem

+ surcouche

(

Hibernate, etc)

Données structurées creuses

Bases de données

orientées colonnes

BigTable

(Google),

HBase

(Apache), Cassandra

(Apache),

Hypertable,

Pandas », etc

Données semi

-structurées

Arbres

Bases de données

orientées

documents

MongoDB

CouchDB

, etc

Graphes,

Réseaux d’objets

Bases de données

orientées

graphes

Entrepôts RDF (Allegro),

Neo4j, Oracle,

IBM, etc

Bases de données NoSQL

Mineure « Data Science » Frédéric Pennerath

Equivalence entre bases de données orientée objets

et relationnelles

Bases de données

orientées objet

Bases de données

relationnelles

Classe

Table

Attributs

typés d’une classe

Schéma d’une table

Adresse des objets

Clé primaire

Référence sur un objet

Clé étrangère

Méthodes des objets

Procédures stockées

Mineure « Data Science » Frédéric Pennerath

Données semi-structurées

livre

date

1668

chapitre

titre

La Cigale

et la

Fourmi

titre

Livre I

des fables

de la

Fontaine La Cigale

ayant

chantée

tout l’été

chapitre

titre

Corbeau

et le

Renard

Maître

Corbeau

sur un

arbre

perché

Données semi-structurées :

Données de type arbre dont les nœuds peuvent être nommés et où les

feuilles sont des valeurs (entiers, chaînes de caractère, etc)

Adaptées aux documents : documents, pages Web, etc

1 / 22 100%

Documents connexes

Présentation PowerPoint

Le meilleur des deux mondes

Cahier des charges 3B

Auteur( - 67,5 Ko ) - book-e

Assistant à la prise de médicaments

API RESTFul et JSON 0. déroulement du TP 1. REST 2. JSON

cahier des charges

JSON, JavaScript Object Notation

Fils de pub - Architexture

Installation - Notes de cours

RFC 4627 : The application/json Media Type for JavaScript Object

Mini projet 2

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

DOCUMENTS SEMI-STRUCTURÉS ET BASES DE DONNEES

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

DOCUMENTS SEMI-STRUCTURÉS ET BASES DE DONNEES

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib