Hadoop - Semaine 8
HBase est un mécanisme pour stocker des données très
volumineuses de type (clé, {valeurs. . . }) et y accéder très
rapidement, mais d’une manière très simpliste :
get 'meteo','id19971225203000','data:temperature'
Hive et Cassandra permettent d’utiliser SQL pour interroger les
données :
SELECT annee, MAX(temperature)
FROM releves
WHERE temperature != 9999 AND quality IN (0,1,4,5,9)
GROUP BY annee;
Hive peut utiliser les données de HBase en tant que tables,
Cassandra gère ses propres tables.
2 / 31 Pierre Nerzic