Database Reference
In-Depth Information
Aus all diesen Gründen glänzt HBase als Grundpfeiler eines OLAP-Systems
(Online Analytical Processing) ist. Zwar können einzelne Operationen lang-
samer sein als vergleichbare Operationen anderer Datenbanken, doch die
Verarbeitung riesiger Datenmengen ist etwas, was HBase auszeichnet. Bei
wirklich großen Queries lässt HBase andere Datenbanken oft hinter sich.
Das erklärt auch, warum HBase häufig bei großen Unternehmen das Rück-
grat von Logging- und Suchsystemen bildet.
4.1
Einführung in HBase
HBase ist eine spaltenorientierte Datenbank, die auf ihre Konsistenz und
Skalierbarkeit stolz ist. Sie basiert auf BigTable, einer hochperformanten,
proprietären Datenbank, die von Google entwickelt und 2006 im White Pa-
per „Bigtable: A Distributed Storage System for Structured Data“ beschrieben
wurde. 1 Ursprünglich zur Verarbeitung natürlicher Sprache entwickelt, be-
gann HBase sein Dasein als Contrib-Paket für Apache Hadoop. Seither wurde
es zu einem Apache-Spitzenprojekt.
Unter Architektur-Aspekten wurde HBase fehlertolerant entworfen. Hardware-
Fehler sind bei einzelnen Maschinen eher selten, doch in einem großen Clus-
ter ist der Ausfall eines Knotens die Norm. Durch das sog. Write-Ahead-Log-
ging und eine verteilte Konfiguration kann sich HBase von einzelnen Server-
Ausfällen schnell erholen.
Darüber hinaus lebt HBase in einem Ökosystem, das seine eigenen zusätzli-
chen Vorteile bietet. HBase basiert auf Hadoop - einer stabilen skalierbaren
Plattform, die ein verteiltes Dateisystem und Mapreduce-Fähigkeiten bietet.
Wo immer Ihnen HBase begegnet, finden Sie auch Hadoop und andere Infra-
strukturkomponenten, die Sie in eigenen Anwendungen nutzen können.
Es wird aktiv von einer Reihe großer Unternehmen für ihre „Big Data“-Proble-
me eingesetzt und weiterentwickelt. Unter anderem hat Facebook im Novem-
ber 2010 HBase als Kernkomponente seiner neuen Messaging-Infrastruktur
angekündigt. Stumbleupon verwendet HBase seit Jahren zur Echtzeit-Da-
tenspeicherung und Analyse. Verschiedene Features der Site werden direkt
von HBase bedient. Twitter nutzt HBase ausgiebig. Das reicht von der Daten-
generierung (für Applikationen wie die Personen-Suche) bis zu Speicherung
von Monitoring/Performance-Daten. Die Liste der HBase nutzenden Unter-
nehmen umfasst auch Größen wie eBay, Meetup, Ning, Yahoo! und viele an-
dere.
1. http://research.google.com/archive/bigtable.html
Search WWH ::




Custom Search