PetaSky
Groupe 1 Gestion de données
23/10/2012
Les besoins du projet LSST
Pouvoir évaluer aussi bien des requêtes simples
que des requêtes complexes
Possibilité d’accéder à des objets en utilisant des
indexes ou en procédant à un parcours (scan)
complet des grosses tables (>> 1 Pétaoctet)
Le temps total d'exécution varie de quelques
secondes à quelques jours selon les requêtes
QSERV a été développé parce que il n’existe aucun
système, gratuit et libre (open source), capable
d’assurer les besoins du projet LSST
23/10/2012 PetaSky G1- gestion de données 2
Données LSST
Table Taille #enregistrements #colonnes (arité)
Object
109 TB
38 B
470
Moving
Object
5 GB
6 M
100
Source
3.6 PB
5 T
125
Forced
Source
1.1 PB
32 T
7
Dernière version de données publiées : PT1.1
Données simulées
2 relations: Object et source
Object: 227 attributs, ~5 Go
Source: 92 attributs, ~85 Go
Les données
23/10/2012 PetaSky G1- gestion de données 3
Type de Requêtes LSST(1/2)
SELECT * FROM Object JOIN Source USING (objectId) WHERE objectId =
293848594;
SELECT * FROM Object WHERE qserv_areaSpec_circle(1.0, 35.0, 5.0/60);
SELECT COUNT(*), MAX(scisql_fluxToAbMag(rFluxGaussian)) FROM Object
WHERE rNumObs >= 5;
1. Petites (quelques seconds )
Exemple: Récupérer tout type d'information sur un seul objet (identifié par un objectId).
2. Moyennes (environ 1 minute)
Exemple: Récupérer n'importe quel type d'information sur un groupe d'objets dans
une petite zone spatiale
3. Coûteuses (environ 1 heure)
Exemple: Analyser tous les objets et appliquer un filtre sur un certain nombre d'attributs
23/10/2012 PetaSky G1- gestion de données 4
Type des requêtes LSST(2/2)
SELECT O.objectId, myFunction(S.taiMidPoint, S.psfFlux) FROM Object AS O
JOIN Source AS S USING (objectId) WHERE O.varProb > 0.75 GROUP BY
O.objectId;
SELECT * FROM Object ORDER BY rGaussianFlux DESC
4. Très coûteuses (environ 1 jour)
Exemple: L'analyse des courbes de lumière à travers une grande zone spatiale
5. Impossibles
Exemple: Une simple opération de tri sur tous les objets
10 Peta => 6 h et 27 min avec 8000 machines (google research)
LSST est équipé de seulement 150 machines
Liste complète des requêtes: http://dev.lsstcorp.org/trac/wiki/dbQueries
Défis LSST :
½ million de requêtes par jour
~50 requêtes simples et ~20 requêtes complexes à n’importe quel moment
23/10/2012 PetaSky G1- gestion de données 5
1 / 13 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !