Database Reference
In-Depth Information
2. Entwickeln Sie ein neues JRuby-Skript zum Import der Daten. Nutzen Sie
den SAX-Parser, den wir auch für den Wikipedia-Import genutzt haben,
und passen Sie ihn an die Nahrungsmitteldaten an.
3. Übergeben Sie die Daten an Ihr Import-Skript, um die Tabelle zu füllen.
4. Nutzen Sie zum Schluss die HBase-Shell und fragen Sie die foods -Tabelle
nach Informationen zu Ihren Lieblingslebensmitteln ab.
4.4 Tag 3: Auf dem Weg in die Cloud
An den ersten beiden Tagen haben wir viele praktische Erfahrungen mit HBa-
se im Standalone-Modus gesammelt. Unsere Experimente haben sich bisher
auf den Zugriff auf einen einzelnen lokalen Server beschränkt. Im richtigen
Leben werden Sie, wenn Sie sich für HBase entscheiden, einen gut dimen-
sionierten Cluster nutzen, um die Performance-Vorteile der verteilten Archi-
tektur ausschöpfen zu können.
Am dritten Tag wollen wir uns dem Betrieb und der Interaktion mit einem
entfernten HBase-Cluster widmen. Zuerst entwickeln wir eine Client-Anwen-
dung in Ruby und stellen damit die Verbindung zu unserem lokalen Server
her. Dazu nutzen wir ein Protokoll namens Thrift. Dann richten wir einen
Multinode-Cluster bei einem Cloud-Serviceprovider - Amazon EC2 - ein. Da-
bei verwenden wir eine Cluster-Management-Technik namens Apache Whirr.
Eine „sparsame“ HBase-Anwendung entwickeln
Bisher haben wir die HBase-Shell genutzt, doch HBase unterstützt eine Reihe
von Protokollen zur Client-Kommunikation. Hier die vollständige Liste:
Name
Verbindungstyp
Produktionstauglich?
Shell
Direkt
Ja
Java API
Direkt
Ja
Thrift
Binärprotokoll
Ja
REST
HTTP
Ja
Avro
Binärprotokoll
Nein (experimentell)
In der obigen Tabelle beschreibt der Verbindungstyp, ob das Protokoll direkte
Java-Aufrufe vornimmt, Daten über HTTP transportiert oder ein kompaktes
Binärformat zur Datenübertragung nutzt. Alle eignen sich für den Produk-
tionseinsatz, nur Avro ist relativ neu und sollte als experimentell betrachtet
werden.
 
Search WWH ::




Custom Search