Ich bin fast bei Cassandra gelandet, nachdem ich nach umfangreichen Datenspeicherlösungen gesucht habe. Es wird jedoch allgemein gesagt, dass Hbase eine bessere Lösung für die Verarbeitung und Analyse von Daten in großem Maßstab ist.
Während beide derselbe Schlüssel- / Wertspeicher sind und beide die Hadoop-Schicht ausführen können (Cassandra kürzlich), ist Hadoop ein besserer Kandidat, wenn die Verarbeitung / Analyse großer Datenmengen erforderlich ist.
Gute Details zu beiden habe ich auch unter http://ria101.wordpress.com/2010/02/24/hbase-vs-cassandra-why-we-moved/ gefunden.
aber ich suche immer noch nach konkreten Vorteilen von Hbase.
Ich bin zwar mehr von Cassandra überzeugt, weil es einfach ist, Knoten hinzuzufügen und nahtlos zu replizieren, und keine Point-of-Failure-Funktionen bietet. Und es behält auch sekundäre Indexfunktion bei, so dass es ein gutes Plus ist.
Der Grund für die Verwendung von 100-Knoten-hBase-Clustern liegt nicht darin, dass HBase nicht auf größere Größen skaliert werden kann. Dies liegt daran, dass es einfacher ist, hBase / HDFS-Software-Upgrades fortlaufend durchzuführen, ohne Ihren gesamten Service zu beeinträchtigen. Ein weiterer Grund besteht darin, zu verhindern, dass ein einzelner NameNode ein SPOF für den gesamten Dienst ist. Außerdem wird HBase für verschiedene Dienste (nicht nur für FB-Nachrichten) verwendet, und es ist ratsam, einen Cookie-Cutter-Ansatz zum Einrichten zahlreicher HBase-Cluster auf der Grundlage eines 100-Knoten-Pod-Ansatzes zu verwenden. Die Zahl 100 ist adhoc, wir haben uns nicht darauf konzentriert, ob 100 optimal ist oder nicht.
quelle