HBase - Sieben Wochen, sieben Datenbanken

Database Reference

In-Depth Information

Apropos Architektur. Wir haben Tabellen-Regionen kennengelernt und ent-

deckt, wie HBase die Verantwortung für sie auf die Regions-Server im Cluster

verteilt. Wir haben die Tabellen .META. und -ROOT- untersucht, um ein Gefühl

für die HBase-Interna zu bekommen.

Abschließend haben wir diskutiert, wie sich das dünnbesetzte Design von

HBase auf die Performance auswirkt. Dabei haben wir auch einige der „Best

Practices“ der Community zum Umgang mit Spalten, Familien und Tabellen

kennengelernt.

Tag 2: Selbststudium

Finden Sie heraus

1. Finden Sie eine Diskussion oder einen Artikel, der die Vor- und Nachteile

der Komprimierung in HBase beschreibt.

2. Finden Sie einen Artikel, der die Funktionsweise von Bloomfiltern be-

schreibt und wie HBase von ihnen profitiert.

3. Welche weiteren Spaltenfamilien-Optionen gibt es (neben dem verwende-

ten Algorithmus) im Zusammenhang mit der Komprimierung?

4. Wie beeinflussen die verwendeten Datentypen und Nutzungsmuster die

Komprimierungsoptionen der Spaltenfamilien?

Machen Sie Folgendes

Bauen Sie basierend auf der Idee des Datenimports eine Datenbank mit

Nährwertangaben auf.

Laden Sie die MyPyramid Raw Food-Daten von Data.gov herunter. 5 Entpa-

cken Sie den Inhalt und suchen Sie Food _ Display _ Table.xml heraus.

Die Daten bestehen aus vielen Paaren von <Food _ Display _ Row> -Tags. Inner-

halb dieser enthält jede Zeile einen <Food _ Code> (Integerwert), einen <Dis-

play _ Name> (String) und andere Fakten zu den Nahrungsmitteln innerhalb

entsprechend benannter Tags.

1. Legen Sie eine neue Tabelle namens foods mit einer einzelnen Spaltenfa-

milie an, um die Fakten zu speichern. Was sollten Sie als Spaltenschlüs-

sel verwenden? Welche Spaltenfamilien-Optionen sind für diese Daten

sinnvoll?

b978-7txq

Search WWH ::

Custom Search

Home