BIG DATA
La version 21 de WINDEV permet d’utiliser les technologies Big
Data Hadoop facilement, directement en WLangage.
nouveauté WD WB WM
Hadoop: architecture dis-
tribuée
Hadoop est un ensemble de technologies (framework) permet-
tant le traitement de volumes de données massifs en utilisant
des clusters de serveurs.
Hadoop en soit n’est pas un logiciel, c’est un «concept».
Parmi les logiciels composant Hadoop on trouve Hbase (la base
de données elle-même), Hive (le langage de requêtage) et HDFS
(couche bas niveau de stockage des fichiers, qui sont forcément
distribués).
Le concept essentiel dans le domaine du «big data» est que
l’architecture de stockage est massivement distribuée, en géné-
ral sur des centaines ou des milliers de serveurs.
Cinq machines (qui peuvent être des machines virtuelles) mini-
mum sont nécessaires pour mettre en place une base Hadoop.
Les architectures Big Data sont «échelonnables» (ou scalables),
c'est-à-dire qu'il est possible d'ajouter des serveurs supplémen-
taires pour absorber la montée en charge des applications.
Les applications développées avec la version 21 accèdent nati-
vement aux clusters de données Hadoop.
Gain apporté par cette nouveauté version 21:
Hadoop au service de vos applications !
nouveauté WD WB WM
Hadoop, NoSQL:
bases de données
non relationnelles
Les bases de données Hadoop sont dénommées bases
«NoSQL».
Ce terme est galvaudé, car ils s’agit en réalité de bases «non re-
lationnelles».
Une base NoSQL est une base qui s’affranchit des limites des
bases de données relationnelles (scalabilité), mais en s’affran-
chissant également de certaines de leurs fonctionnalités: atomi-
cité, cohérence, intégrité référentielle, persistance (les données
ne se perdent pas!), temps réel, ...
Gain apporté par cette nouveauté version 21:
Hadoop au service de vos applications !
nouveauté WD WB WM
Connecteur natif à
Hadoop: Hbase, Hive, HDFS
La version 21 propose un accès natif à Hadoop.
Hadoop permet l’écriture et l’accès aux données selon 3 ni-
veaux hiérarchiques:
• soit au niveau colonne (HBASE)
• soit au niveau «requête», car finalement les concepteurs de
bases NO SQL se sont aperçus que de temps en temps une re-
quête était nécessaire (Hive).
• soit au niveau «fichier» entier (ou bloc de fichier) (HDFS)
Gain apporté par cette nouveauté version 21:
Connecteur natif à Hadoop !
nouveauté WD WB WM
HBase
HBase est une base de données non relationnelle (NoSQL) distri-
buée, orientée colonne disposant d'un stockage non structuré
pour les grandes tables.
HBase est une composante essentielle de Hadoop.
HBase est conçue pour traiter des données aux volumes impor-
tants (plusieurs milliards de lignes, plusieurs millions de co-
lonnes par ligne) et non uniformes (chaque ligne peut avoir une
structure différente des autres lignes).
Dans une base HBase, les données sont stockées dans une
table, de manière dénormalisée.
Une table est découpée en familles de colonnes, qui contien-
nent elles-mêmes des colonnes.
Chaque ligne («row», équivalent d'un enregistrement dans un
SGBD traditionnel) est identifiée par un et un seul «rowKey».
Le «rowKey» est la seule clé de la table.
Une cellule est l’intersection d’une ligne et d’une colonne (rien
de neuf là-dedans !).
L’historique du contenu d’une cellule est conservé de façon ho-
rodatée (avec la date/heure d'écriture).
On peut poser des filtres sur une table HBase (un peu à la ma-
nière d’un filtre sur HFSQL).
Gain apporté par cette nouveauté version 21:
Accédez nativement aux bases Big Data depuis vos applications et
vos sites .
nouveauté WD WB WM
HBase : programmation
La version 21 propose une nouvelle famille de fonctions WLan-
gage pour accéder aux bases HBase.
Ces nouvelles fonctions WLangage permettent de créer une
table, d'ajouter des lignes «row», de lire des données et de sup-
137
138
139
140
141
35
Les nouveautés WINDEV 21 WEBDEV 21 WINDEV Mobile 21