PetaSky Groupe 1 – Gestion de données

Téléchargement

PetaSky

Groupe 1 – Gestion de données

23/10/2012

Les besoins du projet LSST

•Pouvoir évaluer aussi bien des requêtes simples

que des requêtes complexes

•Possibilité d’accéder à des objets en utilisant des

indexes ou en procédant à un parcours (scan)

complet des grosses tables (>> 1 Pétaoctet)

•Le temps total d'exécution varie de quelques

secondes à quelques jours selon les requêtes

QSERV a été développé parce que il n’existe aucun

système, gratuit et libre (open source), capable

d’assurer les besoins du projet LSST

23/10/2012 PetaSky G1- gestion de données 2

Données LSST

Table Taille #enregistrements #colonnes (arité)

Object

109 TB

38 B

470

Moving

Object

5 GB

6 M

100

Source

3.6 PB

5 T

125

Forced

Source

1.1 PB

32 T

•Dernière version de données publiées : PT1.1

–Données simulées

–2 relations: Object et source

•Object: 227 attributs, ~5 Go

•Source: 92 attributs, ~85 Go

•Les données

23/10/2012 PetaSky G1- gestion de données 3

Type de Requêtes LSST(1/2)

SELECT * FROM Object JOIN Source USING (objectId) WHERE objectId =

293848594;

SELECT * FROM Object WHERE qserv_areaSpec_circle(1.0, 35.0, 5.0/60);

SELECT COUNT(*), MAX(scisql_fluxToAbMag(rFluxGaussian)) FROM Object

WHERE rNumObs >= 5;

1. Petites (quelques seconds )

Exemple: Récupérer tout type d'information sur un seul objet (identifié par un objectId).

2. Moyennes (environ 1 minute)

Exemple: Récupérer n'importe quel type d'information sur un groupe d'objets dans

une petite zone spatiale

3. Coûteuses (environ 1 heure)

Exemple: Analyser tous les objets et appliquer un filtre sur un certain nombre d'attributs

23/10/2012 PetaSky G1- gestion de données 4

Type des requêtes LSST(2/2)

SELECT O.objectId, myFunction(S.taiMidPoint, S.psfFlux) FROM Object AS O

JOIN Source AS S USING (objectId) WHERE O.varProb > 0.75 GROUP BY

O.objectId;

SELECT * FROM Object ORDER BY rGaussianFlux DESC

4. Très coûteuses (environ 1 jour)

Exemple: L'analyse des courbes de lumière à travers une grande zone spatiale

5. Impossibles

Exemple: Une simple opération de tri sur tous les objets

• 10 Peta => 6 h et 27 min avec 8000 machines (google research)

• LSST est équipé de seulement 150 machines

•Liste complète des requêtes: http://dev.lsstcorp.org/trac/wiki/dbQueries

•Défis LSST :

•½ million de requêtes par jour

•~50 requêtes simples et ~20 requêtes complexes à n’importe quel moment

23/10/2012 PetaSky G1- gestion de données 5

1 / 13 100%

Documents connexes

MySQL Base de données relationnelles très populaire diffusée

Création d`une base de données

Bases de Données - UFR de Mathématiques

Un outil extrêmement puissant La représentation des données sous

Access ² Fonctions de base

La donnée, c`est l`or noir du 21e siècle

Access Devoir maison - GIPSA-Lab

Introduction aux Bases de Données Relationnelles

Conception de bases de données scientifiques à - UR Aida

Clipper - BI Conseil

langage SQL - Formasoft|pro

Perfectionnement ACCESS

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

PetaSky Groupe 1 – Gestion de données

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

PetaSky Groupe 1 – Gestion de données

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib