Gestion des données - Analyse en ligne

publicité
Stockage
Analyse en ligne
Gestion des données - Analyse en ligne
Olivier Schwander <[email protected]>
UPMC
6 mars 2017
1 / 16
Stockage
Analyse en ligne
Entrepôt de données
Stockage
I
Sources hétérogènes
I
Permanent
Orienté sujet
I
Faits
I
Dimensions
2 / 16
Stockage
Analyse en ligne
Modèle dimensionnel
Faits
I
Événements élémentaires intéressants l’entreprise
I
Décrits par des mesures organisées selon des dimensions
Dimensions
I
Axes utilisés pour l’analyse
Mesures
I
Caractéristiques
3 / 16
Stockage
Analyse en ligne
Exemples
Fait : vente
I
Dimensions : temps, espace
I
Mesure : valeur
Fait : stock de denrées alimentaires
I
Dimension : temps, espace, date de péremption
I
Mesure : quantité
Fait : ressources humaines
I
Dimensions : âge, affectation, nombre de jours d’arrêt-maladie
I
Fait : productivité, nombre de jours d’arrêt-maladie
4 / 16
Stockage
Analyse en ligne
Stockage dans un SGBD relationnel
Table de faits
I
Directement les mesures
I
Clés étrangères vers les dimensions
Table de dimensions
I
Toute information utile
I
Exemple pour une date : date complète, jour, mois année,
numéro de semaine, jour férié, année fiscale, année civile,
année scolaire
5 / 16
Stockage
Analyse en ligne
Idée générale
Tableaux multidimensionnels
I
Hypercube
Cases
I
Décrites par des dimensions
I
Contenant une ou plusieurs mesures
6 / 16
Stockage
Analyse en ligne
Hypercube
Dim 1
Dim 2
Dim 3
Mesure
7 / 16
Stockage
Analyse en ligne
OLAP : Online Analytical Processing
Online
I
Résultat obtenus immédiatement
Transversal
I
Plusieurs départements
I
Plusieurs activités
Prise de décision
I
Opposé du système opérationnel
8 / 16
Stockage
Analyse en ligne
OLAP
Opérations génériques
I
Par des non-experts
I
Peu importe la nature des données
But
I
Calcul et mise à jour des hypercubes
Requêtes dans l’hypercube
I
Langage de requête
9 / 16
Stockage
Analyse en ligne
Hiérarchies
Différents niveaux de détails possibles.
10 / 16
Stockage
Analyse en ligne
Manipulation du cube
I
Rotate : sélection des dimensions
I
Slicing : extraction d’une tranche
I
Scoping : extraction d’un bloc de données
I
Drill-up : zoom arrière
I
Drill-down : zoom avant
I
Drill-through : mouvement dans une dimension
11 / 16
Stockage
Analyse en ligne
Rotate
Dim 1
Dim 3
Dim 2
Dim 3
Dim 1
Dim 2
12 / 16
Stockage
Analyse en ligne
Slicing
13 / 16
Stockage
Analyse en ligne
Drill-up, drill-down
Dim 1
Dim 3
Dim 2
Dim 3
Dim 1
Dim 2
14 / 16
Stockage
Analyse en ligne
Drill-through
Mouvement selon une dimension
I
Valeurs proches
I
Proche selon quel critère ?
I
Ordre numérique, alphabétique, proximité géographique,
data-mining
15 / 16
Stockage
Analyse en ligne
Requêtes sur le cube
MDX : multidimensioal expressions
I
Proche du SQL et des tableurs
I
Traduction des demandes vers le stockage concret
Exemple
SELECT
{ [Measures].[Store Sales] } ON COLUMNS,
{ [Date].[2002], [Date].[2003] } ON ROWS
FROM Sales
WHERE ( [Store].[USA].[CA] )
16 / 16
Téléchargement