HBase - Sieben Wochen, sieben Datenbanken

Database Reference

In-Depth Information

2. Entwickeln Sie ein neues JRuby-Skript zum Import der Daten. Nutzen Sie

den SAX-Parser, den wir auch für den Wikipedia-Import genutzt haben,

und passen Sie ihn an die Nahrungsmitteldaten an.

3. Übergeben Sie die Daten an Ihr Import-Skript, um die Tabelle zu füllen.

4. Nutzen Sie zum Schluss die HBase-Shell und fragen Sie die foods -Tabelle

nach Informationen zu Ihren Lieblingslebensmitteln ab.

4.4 Tag 3: Auf dem Weg in die Cloud

An den ersten beiden Tagen haben wir viele praktische Erfahrungen mit HBa-

se im Standalone-Modus gesammelt. Unsere Experimente haben sich bisher

auf den Zugriff auf einen einzelnen lokalen Server beschränkt. Im richtigen

Leben werden Sie, wenn Sie sich für HBase entscheiden, einen gut dimen-

sionierten Cluster nutzen, um die Performance-Vorteile der verteilten Archi-

tektur ausschöpfen zu können.

Am dritten Tag wollen wir uns dem Betrieb und der Interaktion mit einem

entfernten HBase-Cluster widmen. Zuerst entwickeln wir eine Client-Anwen-

dung in Ruby und stellen damit die Verbindung zu unserem lokalen Server

her. Dazu nutzen wir ein Protokoll namens Thrift. Dann richten wir einen

Multinode-Cluster bei einem Cloud-Serviceprovider - Amazon EC2 - ein. Da-

bei verwenden wir eine Cluster-Management-Technik namens Apache Whirr.

Eine „sparsame“ HBase-Anwendung entwickeln

Bisher haben wir die HBase-Shell genutzt, doch HBase unterstützt eine Reihe

von Protokollen zur Client-Kommunikation. Hier die vollständige Liste:

Name

Verbindungstyp

Produktionstauglich?

Shell

Direkt

Ja

Java API

Direkt

Ja

Thrift

Binärprotokoll

Ja

REST

HTTP

Ja

Avro

Binärprotokoll

Nein (experimentell)

In der obigen Tabelle beschreibt der Verbindungstyp, ob das Protokoll direkte

Java-Aufrufe vornimmt, Daten über HTTP transportiert oder ein kompaktes

Binärformat zur Datenübertragung nutzt. Alle eignen sich für den Produk-

tionseinsatz, nur Avro ist relativ neu und sollte als experimentell betrachtet

werden.

Sieben Wochen, sieben Datenbanken

Search WWH ::

Custom Search

Home