Database Reference
In-Depth Information
Apropos Architektur. Wir haben Tabellen-Regionen kennengelernt und ent-
deckt, wie HBase die Verantwortung für sie auf die Regions-Server im Cluster
verteilt. Wir haben die Tabellen .META. und -ROOT- untersucht, um ein Gefühl
für die HBase-Interna zu bekommen.
Abschließend haben wir diskutiert, wie sich das dünnbesetzte Design von
HBase auf die Performance auswirkt. Dabei haben wir auch einige der „Best
Practices“ der Community zum Umgang mit Spalten, Familien und Tabellen
kennengelernt.
Tag 2: Selbststudium
Finden Sie heraus
1. Finden Sie eine Diskussion oder einen Artikel, der die Vor- und Nachteile
der Komprimierung in HBase beschreibt.
2. Finden Sie einen Artikel, der die Funktionsweise von Bloomfiltern be-
schreibt und wie HBase von ihnen profitiert.
3. Welche weiteren Spaltenfamilien-Optionen gibt es (neben dem verwende-
ten Algorithmus) im Zusammenhang mit der Komprimierung?
4. Wie beeinflussen die verwendeten Datentypen und Nutzungsmuster die
Komprimierungsoptionen der Spaltenfamilien?
Machen Sie Folgendes
Bauen Sie basierend auf der Idee des Datenimports eine Datenbank mit
Nährwertangaben auf.
Laden Sie die MyPyramid Raw Food-Daten von Data.gov herunter. 5 Entpa-
cken Sie den Inhalt und suchen Sie Food _ Display _ Table.xml heraus.
Die Daten bestehen aus vielen Paaren von <Food _ Display _ Row> -Tags. Inner-
halb dieser enthält jede Zeile einen <Food _ Code> (Integerwert), einen <Dis-
play _ Name> (String) und andere Fakten zu den Nahrungsmitteln innerhalb
entsprechend benannter Tags.
1. Legen Sie eine neue Tabelle namens foods mit einer einzelnen Spaltenfa-
milie an, um die Fakten zu speichern. Was sollten Sie als Spaltenschlüs-
sel verwenden? Welche Spaltenfamilien-Optionen sind für diese Daten
sinnvoll?
5. http://explore.data.gov/Health-and-Nutrition/MyPyramid-Food-Raw-Data/
b978-7txq
Search WWH ::




Custom Search