Database Reference
In-Depth Information
Die grundlegende Architektur ist aber in allen Anwendungsfällen vergleichbar. Eine sehr
detaillierte Darstellung und Beschreibung einer Referenzarchitektur indet sich bei [BG04,
S.31 ff.]. Die Abbildung 2.14 zeigt sehr vereinfacht die klassischen Komponenten des ETL-
Prozesses.
Quellsysteme
Zielsysteme
Extraktion
Laden
Transformation
relevante Daten
werden aus den
Quellsystemen
(operative
Datenbanken,
Flatfiles,
Dokumente
usw.) extrahiert
extrahierte
Daten werden
vereinheitlicht,
konsolidiert,
angereichert,
aggregriert usw.
transformierte
Daten werden
in das
Zielsystem
übertragen
Data
Warehouse
Data Marts
BILD 2.14 ETL-Prozess-Allgemein
Für die Realisierung der Teilschritte des ETL-Prozesses sind unterschiedliche Architektu-
ren denkbar. So könnte im operativen System ein Arbeitsbereich reserviert sein, in den die
benötigten Daten aus den Quellsystemen extrahiert werden. Die extrahierten Daten könn-
ten dort auch aufbereitet werden und von dort direkt in das Zielsystem geladen werden.
Dies spart ein weiteres System, beeinträchtigt aber mehr oder weniger stark die Perfor-
mance des operativen Systems. Ebenso denkbar wäre es, die benötigten Daten direkt in
einen reservierten Bereich des Zielsystems zu laden und sie erst dort aufzubereiten. Dies
spart ebenfalls ein weiteres System, geht dann aber zu Lasten des analytischen Systems.
ETL-Server
Quellsysteme
Zielsysteme
Extraktion
Transformation
Laden
relevante Daten
werden aus den
Quellsystemen
(operative
Datenbanken,
Flatfiles,
Dokumente
usw.) extrahiert
transformierte
Daten werden
in das
Zielsystem
übertragen
extrahierte
Daten werden
vereinheitlicht,
konsolidiert,
angereichert,
aggregriert usw.
Data
Warehouse
Data Marts
BILD 2.15 ETL-Prozess-Varianten
Auf der Grundlage dieser Überlegungen entstanden spezielle ETL-Tools, bei denen alle
oder ausgewählte Schritte des ETL-Prozesses in ein separates System ausgelagert werden.
In der Abbildung 2.15 sind Extraktion, Transformation und Laden einem ETL-System zuge-
ordnet, das z. B. ein separater ETL-Server sein könnte, wie er von verschiedenen Herstellern
angeboten wird. Dieser würde getrennt von Quell- und Zielsystemen betrieben werden.
Der Vorteil besteht bei dieser Variante in der geringeren Belastung der Quell- und Zielsys-
teme.
Search WWH ::




Custom Search