Mineure « Data Science » Frédéric Pennerath
Rappel sur les données structurées et
les bases relationnelles
Données structurées ou tables :
Liste de n-uplets à champs nommés et typés selon
un schéma fixe
Base de données relationnelles
Ensemble de tables et leurs schémas
Remarques :
•Chaque table a une clé primaire (pas de
doublons)
•Langage de requête SQL fondé sur
l’algèbre relationnelle : sélection,
projection, jointure
•Optimisation des requêtes : index (B-tree),
optimiseur de plans d’exécution, cache
mémoire
•Données utilisées après jointure par les
méthodes de machine learning (Weka,
scikit-learn)