Database Reference
In-Depth Information
Bei all dieser Aktivität kommen neue HBase-Versionen in recht schneller Fol-
ge heraus. Während diese Zeilen geschrieben werden, ist 0.90.3 die aktuelle
stabile Version, die wir hier auch verwenden. Also laden Sie HBase herunter
und los geht's.
4.2 Tag 1: CRUD und Tabellenadministration
Das Ziel des heutigen Tages besteht darin, die Grundlagen des Umgangs mit
HBase zu lernen. Wir werden eine lokale Instanz von HBase im Standalone-
Modus betreiben und dann die HBase-Shell nutzen, um Tabellen anzule-
gen und zu verändern, sowie Daten mit elementaren Befehlen einfügen und
modifizieren. Danach wollen wir untersuchen, wie man einige dieser Opera-
tionen programmtechnisch vornimmt, indem wir die HBase Java API in JRu-
by nutzen. Nebenbei enthüllen wir einige HBase-Architekturkonzepte wie die
Beziehung zwischen Zeilen, Spaltenfamilien und den Werten in einer Tabelle.
Ein voll funktionsfähiges HBase-Cluster für den Produktiveinsatz (so die land-
läufige Meinung) sollte aus nicht weniger als fünf Knoten bestehen. Für un-
sere Bedürfnisse wäre ein solches Setup allerdings etwas zu viel des Guten.
Glücklicherweise unterstützt HBase drei Betriebsmodi:
Im Standalone-Modus arbeitet eine einzelne Maschine allein.
Im pseudoverteilen (pseudodistributed) Modus gibt ein einzelner Knoten
vor, ein Cluster zu sein.
Im vollständig verteilten (fully distributed) Modus arbeitet ein Cluster von
Knoten zusammen.
Im Großteil dieses Kapitels betreiben wir HBase im Standalone-Modus. Doch
selbst das kann eine Herausforderung sein, und obwohl wir nicht jeden As-
pekt der Installation und Administration behandeln, geben wir an geeigneten
Stellen Tipps zur Fehlersuche.
HBase konigurieren
Bevor man HBase nutzen kann, muss es konfiguriert werden. Die Konfi-
gurationseinstellungen für HBase finden Sie in einer Datei namens
hbase-
site.xml
, die Sie im Verzeichnis
${HBASE
_
HOME}/ conf/
finden. Beachten Sie,
dass
HBASE
_
HOME
eine Umgebungsvariable ist, die auf das Verzeichnis ver-
weist, in dem HBase installiert wurde.
Anfangs enthält diese Datei nur einen leeren
<configuration>
-Tag. Sie kön-
nen in der Konfiguration eine beliebige Anzahl von Eigenschaften (Properties)
im folgenden Format definieren: