Il peut être facilement mis à l’échelle d’un certain ensemble de nœuds à un
ensemble supérieur de nœuds par une simple addition de nœuds supplémentaires
de manière linéaire sans avoir à entrer dans les complexités, et il donne une
augmentation immédiate du débit et du temps de réponse.
Une distribution sans faille
Cette base de données NoSQL vous permet de distribuer vos données de manière
transparente sur plusieurs data centers par un simple processus de réplication des
données.
Haute fiabilité
Cassandra est conçu pour gérer la défaillance des nœuds de la grappe sans affecter
les performances de quelque manière que ce soit, car il ne présente pas de
défaillance d’un seul nœud, une caractéristique essentielle pour les applications
critiques.
Support pour ACID
Les propriétés d’ACID (atomicité, consistance, isolation et durabilité) sont bien
prises en charge par la base de données Cassandra, ce qui est une caractéristique
assez importante puisque les transactions d’ACID sont prises en charge par le
SGBDR.
La technologie NoSQL de Cassandra, si répandue aujourd’hui, a vu le jour dans le
labo de recherche de Facebook. Le géant des médias sociaux open source a lancé
Cassandra en juillet 2008. Elle a été intégrée à l’incubateur Apache en 2009 et a
finalement fait partie du projet Apache high level en 2010. Aujourd’hui, il fait partie
intégrante de l’Apache Software Foundation et peut être utilisé par toute personne
souhaitant bénéficier de ses multiples usages. Le système de distribution de fichiers
de Cassandra est un système peer-to-peer entre les nœuds, et grâce à cela, toutes
les données sont distribuées sur l’ensemble des nœuds de la grappe.
Tout nœud de la grappe peut accepter les demandes de lecture ou d’écriture de
données, que les données résident ou non dans la grappe. Le processus de
réplication des données à Cassandra se fait par l’intermédiaire de certains nœuds
qui jouent le rôle de réplicateurs pour un certain volume de données. Aujourd’hui, il y
a une grande quantité de données, et ces données sont validées pour être à jour ou
non. Si ce ne sont pas les dernières données, alors Cassandra reviendra avec la
dernière valeur des données. Les données périmées sont alors révisées avec la
dernière valeur afin de maintenir le système à jour.
Architecture de Cassandra
Voici quelques-uns des éléments clés de l’architecture de Cassandra :
Cluster : Il s’agit d’un ensemble complet de plusieurs data centers sur lesquels sont
stockées toutes les données pour être traitées dans la base de données Cassandra
NoSQL.
Data center : Un ensemble de nœuds connexes sont regroupés dans un data center.
Nœud : L’endroit spécifique où les données résident sur le cluster est appelé un nœud.
Commit log : C’est une méthode à sécurité intégrée qui est déployée par Cassandra afin
de prendre une sauvegarde de toutes les données de la base de données Cassandra en les
écrivant dans le journal de commit.