Hive et HadoopDB - LIRIS

Téléchargement

Declarative queries on large astronomy databases :

Experiments with Hive and HadoopDB

Projet soutenu par le CNRS dans le cadre du

défi: Grandes masses de données

scientifiques -MASTODONS

http://com.isima.fr/Petasky

Amin Mesmoudi (LIRIS)

Mohand-Saïd Hacid (LIRIS)

Farouk Toumani (LIMOS)

Le flot de données LSST

•Caméra : 198 CCD (16 Mpix) en parallèle

→ 3,2 G pixels !

~ 6 Gbyte / 17 secondes

→ 15 TB / nuit

Pendant 10 ans !

http://www.lsst.org/lsst/science/science_goals 2

Le flot de données LSST

•Caméra : 198 CCD (16 Mpix) en parallèle

→ 3,2 G pixels !

~ 6 Gbyte / 17 secondes

→ 15 TB / nuit

Pendant 10 ans !

http://www.lsst.org/lsst/science/science_goals 2

Les données LSST sont-elles

’’big’’?

Table Taille #enregistrements

#colonnes (

arité

)

Object

109 TB

38 B

470

Moving

Object

5 GB

6 M

100

Source

3.6 PB

5 T

125

Forced

Source

1.1 PB

32 T

Difference

Image Source

71 TB

200 B

CCD

Exposure

0.6 TB

17 B

Accès aux données

•Accès

•Requêtes déclaratives (SQL)

•Possibilité de définir des fonctions

ad hoc par l’utilisateur (UDF)

•Exemple: areaspec_box, angSep < dist

SELECT objectId, taiMidPoint, fluxToAbMag(psfMag)

FROM Source JOIN Object USING(objectId) JOIN

Filter USING(filterId)

WHERE areaSpec_box(:raMin, :declMin,:raMax,

:declMax) AND filterName ='u' AND variability

BETWEEN :varMin AND :varMax

ORDER BY objectId, taiMidPoint ASC

Liste complète des requêtes: http://dev.lsstcorp.org/trac/wiki/dbQueries

Défis LSST :

•½ million de requêtes par jour

•~50 requêtes simples et ~20 requêtes complexes à n’importe quel moment

1 / 27 100%

Documents connexes

cloud experiments liris presentation

PetaSky

Gestion et exploration des grandes masses de - LIRIS

Entreprise 29 - Offre 141

PetaSky Groupe 1 – Gestion de données

Formation Cloudera Data Analyst

Bases de Données - UFR de Mathématiques

Formation langage SQL - Création et gestion de systeme de base

Un outil extrêmement puissant La représentation des données sous

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Hive et HadoopDB - LIRIS

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Hive et HadoopDB - LIRIS

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib