Database Reference
In-Depth Information
verbunden und erfolgt Zeile für Zeile. Jede Zeile kann eine andere Menge an
Spalten besitzen, auch gar keine, wodurch die Tabellen dünn besetzt (spar-
se) bleiben, ohne Speicherkosten für Nullwerte zu erzeugen. Hinsichtlich der
Struktur ist eine spaltenorientierte Datenbank ein Mittelding zwischen rela-
tionaler und KV-Datenbank.
Auf demMarkt spaltenorientierter Datenbanken herrscht etwas weniger Wett-
bewerb als bei relationalen Datenbanken oder KV-Stores. Die drei bekann-
testen Vertreter sind HBase (das wir in Kapitel 4, HBase , auf Seite 103 be-
handeln), Cassandra und Hypertable.
HBase
Diese spaltenorientierte Datenbank hat von allen hier behandelten nichtre-
lationalen Datenbanken die meisten Gemeinsamkeiten mit dem relationalen
Modell. Mit Googles BigTable-Papier als Blaupause baut HBase auf Hadoop
(einer mapreduce-Engine) auf und wurde entworfen, um horizontal gut auf
Clustern handelsüblicher Hardware zu skalieren. HBase gibt hohe Garantien
im Bezug auf die Konsistenz ab und kennt Tabellen mit Zeilen und Spalten
- wodurch sich SQL-Fans gleich heimisch fühlen sollten. Durch die direkte
Unterstützung von Versionierung und Komprimierung hebt sich diese Da-
tenbank im „Big Data“-Bereich ab.
Dokumentenorientiert
Dokumentenorientierte Datenbanken speichern, nun ja, Dokumente. Kurz
gesagt ist ein Dokument wie ein Hash. Es enthält ein eindeutiges ID-Feld und
Werte unterschiedlichster Typen, einschließlich weiterer Hashes. Dokumen-
te können verschachtelte Strukturen enthalten und bieten daher einen ho-
hen Grad an Flexibilität, was variable Bereiche erlaubt. Das System legt den
eingehenden Daten nur wenige Beschränkungen auf, solange sie die grund-
legende Anforderung erfüllen, in Form eines Dokuments ausgedrückt wer-
den zu können. Die verschiedenen Dokument-Datenbanken verfolgen un-
terschiedliche Strategien im Bezug auf Indexierung, Ad-hoc-Abfragen, Repli-
kation, Konsistenz und andere Design-Entscheidungen. Um vernünftig zwi-
schen ihnen wählen zu können, müssen Sie diese Unterschiede verstehen
und wissen, wie sich das auf Ihren jeweiligen Anwendungsfall auswirkt.
Die beiden wichtigsten Open-Source-Player auf dem Markt der Dokumenten-
Datenbanken sind MongoDB, die wir in Kapitel 5, MongoDB , auf Seite 147
behandeln, und CouchDB, die in Kapitel 6, CouchDB , auf Seite 193 diskutiert
wird.
Search WWH ::




Custom Search