Database Reference
In-Depth Information
▪ AP (Availability und Partition Tolerance): Hier finden sich unter anderem die NoSQL-
Datenbanksysteme CouchDB, RIAK und Cassandra.
▪ CP (Consistency und Partition Tolerance): MongoDB, MemcacheDB und Rdis sind
hier (unter anderem) einzustufen.
Demnach sind AP und CP für die Skalierung auf eine Vielzahl von Datenbanken geeignet.
Das klassische relationale Datenbankmodell ist durch die Beziehungen der Tabellen unter-
einander schwerer horizontal zu skalieren. Einen guten Überblick bekommen Sie unter [5].
Einteilungen von NoSQL-Datenbanken
Die modernen NoSQL-Datenbanken können in mehrere Bereiche eingeteilt werden. Maß-
gebend für diese Einteilung ist die Art der Datenlogik.
Typen von NoSQL-Datenbanken
Dokumentenbasierte Datenbanken : Hier werden die Daten nicht in Spalten und Ta-
bellen gespeichert, sondern in so genannten Dokumenten. Ein Dokument ist in die-
sem Fall eine Ansammlung von Feldern und Werten Es gibt in der Datenbank keine
Definition dieser Dokumente. Ein Dokument kann verändert werden, indem die Werte
in vorhandene Felder geändert werden oder zusätzliche Felder hinzukommen bzw.
vorhandene Felder gelöscht werden. Typische Dokumentstrukturen sind JSon oder
XML. Es gibt keine Verbindungen der Daten untereinander, alle Beziehungen müssen
in der Software definiert werden. Die bekanntesten Vertreter dieser Klasse sind
CouchDB und MongoDB.
Key-Value Stores : Sind noch am ehesten mit assoziativen Arrays zu vergleichen. Ein
Schlüssel zeigt auf einen Datensatz mit einem einfachen Typ wie Text, Zahl, Liste.
Hierzu zählen Riak, Redis und MemcacheDB.
Spaltenorientierte Datenbanken : Spaltenorientierte Datenbanken speichern die
Werte physikalisch nicht in Zeilen, sondern in Spalten. Das heißt, wenn ein Datensatz
gelesen wurde, ist der nächste Datensatz nicht die folgende Spalte der gleichen Zeile
bzw. die erste Spalte der folgenden Zeile, sondern die gleiche Spalte der folgenden
Zeile. Diese Art der Datenbanken eignet sich für die Verarbeitung und Analyse großer
Datenmengen, bei denen viele Felder eines Datensatzes unberücksichtigt bleiben
(z. B. die Aufsummierung von Niederschlagswerten seit 1900, bei der die weiteren
Spalten wie Datum, Ort etc. nicht von großer Bedeutung sind). Ein weiterer Vorteil ist
die Möglichkeit der Komprimierung der Spaltenwerte. Da pro Spalte der gleiche Da-
tentyp vorgesehen ist, kann man zusammenhängende gleiche Werte sehr leicht kom-
primieren. Wenn es nach Professor Hasso Plattner, dem Gründer von SAP geht, wer-
den die Daten in ERP-Systemen künftig über diese Art gespeichert werden [6]. Der
Search WWH ::




Custom Search