Databases Reference
In-Depth Information
Ein Attribut wie titel hat in weit über 90% der Datensätze den Wert null
und bläht den Platz auf, den die Daten auf der Festplatte einnehmen. Weil
sich dadurch die Transportzeiten von der Festplatte zum Hauptspeicher ver-
längern, müssen wir auch hier mit Performance-Einbußen rechnen.
Hier bieten sich auch XML-Datenbanken an. Es müssen nicht zwingend XML-
Dokumente im engeren Sinne sein, die in einer solchen Datenbank abgelegt wer-
den. Es ist auch denkbar, dass wir Daten, denen die Struktur einer statischen Ta-
belle fehlt, in ein XML-Dokument einbetten und in einer XML-Daten ablegen.
23.2
Gewaltige Datenmengen
Eine weitere Herausforderung für moderne DBMS besteht darin, dass Anwen-
dungen aus dem Web-2.0 Umfeld
Daten im Petabyte-Bereich generieren und
potenziell von Millionen von Anwendern genutzt werden.
Dazu zählen soziale Netzwerke wie Twitter oder Facebook oder ein Versandhaus
wie Amazon. Eine Maschine reicht hier bei Weitem nicht aus, um die Daten be-
reitzustellen. Es wird notwendig, den Datenbestand über viele Computer zu ver-
teilen. Die Daten müssen natürlich an jedem Ort der Welt erreichbar sein. Doch
sollten die Maschinen idealerweise so über die Welt verteilt sein, dass Daten aus
geographischer Sicht in der Nähe ihrer Anwender sind, um die Transportzeiten
über das Netzwerk zu minimieren.
Wenn ein Unternehmen Dienstleistungen über das Internet anbietet, dann kön-
nen sich aus dem Ausfall eines DBMS erhebliche Umsatzeinbußen ergeben. Die
Verfügbarkeit des Systems hat somit eine sehr hohe Priorität. Ein Versandhandel
wie Amazon will, dass seine Kunden immer Produkte kaufen können.
Auch die RDBMS der etablierten Hersteller bieten die Möglichkeit,
Daten auf mehrere Knoten zu verteilen (data sharding), oder
Replikate der Daten auf mehreren Knoten zu halten und so eine nahezu belie-
big hohe Verfügbarkeit zu erreichen.
Gerade diese Produkteigenschaften sind bei den RDBMS-Herstellern bereits seit
Jahren ein Hauptgegenstand der Forschung und Entwicklung. Für die DB2 wur-
den bereits um das Jahr 2000 Benchmark-Szenarien mit mehreren Hundert Kno-
ten aufgebaut. Diese hochwertige RDBMS-Software geht allerdings auch mit Li-
zenzgebühren einher, die sich bei der Verteilung auf viele Knoten entsprechend
vervielfachen.
 
Search WWH ::




Custom Search