Database Reference
In-Depth Information
KAPITEL
HBase
Apache HBase ist, wie eine Nagelpistole, für große Jobs gemacht. Sie wür-
den HBase niemals nutzen, um die Vertriebsliste Ihres Unternehmens zu
katalogisieren, ebensowenig wie Sie eine Nagelpistole nutzen würden, um
ein Puppenhaus zu bauen. Wenn Ihre Daten nicht viele Gigabytes umfassen,
brauchen Sie sehr wahrscheinlich ein kleineres Tool.
HBase erinnert auf den ersten Blick stark an eine relationale Datenbank,
und zwar so sehr, dass man glauben könnte, es wäre eine, wenn man es
nicht besser wüsste. Wenn Sie HBase erlernen wollen, ist die Technik nicht
die größte Herausforderung, sondern dass viele der von HBase verwendeten
Wörter einem so schmeichlerisch und trügerisch vertraut sind. Zum Beispiel
speichert HBase Daten in Tabellen ,die Zellen enthalten, die bei den Schnitt-
punkten von Zeilen und Spalten liegen. Soweit, so gut, richtig?
Falsch! Bei HBase verhalten sich Tabellen nicht wie Relationen, Zeilen die-
nen nicht als Datensätze und Spalten sind vollständig variabel (werden also
nicht durch die Schema-Beschreibung vorgegeben). Das Schema-Design ist
für die Performance-Charakteristika des System immer noch wichtig, hält
Ihre Daten aber nicht in Ordnung. HBase ist der böse Zwilling (wenn Sie so
wollen, der Bizarro) der RDBMS.
Warum sollte man diese Datenbank also verwenden? Neben der Skalierbar-
keit gibt es verschiedene Gründe. Erstens besitzt HBase einige Features, die
anderen Datenbanken fehlen, etwa Versionierung, Komprimierung, Garbage
Collection (für abgelaufene Daten) und speicherbasierte (In-Memory) Tabel-
len. Diese Features von Haus aus zur Verfügung zu haben, bedeutet, dass
man weniger Code schreiben muss, wenn die Anforderungen sie verlangen.
HBase macht auch hohe Garantien in Bezug auf die Konsistenz, was den
Wechsel von relationalen Datenbanken vereinfacht.
Search WWH ::




Custom Search