Database Reference
In-Depth Information
werden abhängig von der Extraktionsstrategie in der Regel nur noch die geänderten Daten
übernommen.
Zusammenfassend die wesentlichen Vor- und Nachteile des ETL-Ansatzes:
Vorteile ETL
Keine zusätzliche Belastung durch rechenintensive Transformationen im Zielsystem,
Daten liegen bereits im Zielformat vor
Nur relevante und für geändert befundene Daten werden extrahiert
Vielzahl an ETL-Tools vorhanden (kommerzielle sowie Open Source)
ETL-Tools
bieten
graische
Unterstützung
des
Datenlusses
sowie
integrierte
Datenbereinigungs- und Transformationsfunktionen
Zusätzliche Hardware des ETL-System ist unabhängig vom Zielsystem skalierbar
Nachteile ETL
Zusätzliche Hardware-Investitionen für ETL-System
Hohe Netzwerklast durch Datentransfer in und aus dem ETL-System
Häuig zusätzliche Lizenzierungskosten für ETL-Tool
Spezialisiertes Fachwissen über ETL-Tool notwendig
2.5.1.4 ETL vs. ELT
Mit der zunehmenden Mächtigkeit der verwendeten Datenbankmanagementsysteme
wuchsen auch die Möglichkeiten, immer mehr Aufgaben klassischer ETL-Tools in die Da-
tenbank zu verlagern. Im Unterschied zu dem klassischen ETL-Ansatz sieht der moderne
Extraktion-Laden-Transformation (ELT)-Ansatz eine Entkoppelung der Teilschritte sowie
die Verlagerung der Transformationen in das Zielsystem vor. Dabei werden die erforder-
lichen Daten wie beim ETL-Ansatz zunächst aus den Quellen extrahiert. Anders als beim
traditionellen Ansatz werden die überführten Daten jedoch direkt in das Zielsystem kopiert
und erst auf Anfrage erfolgen die erforderlichen Transformationen [Sun09]. Die Transfor-
mation der Daten übernimmt die Infrastruktur des entsprechenden Zielsystems. Das kann
mit Hilfe von nativen SQL-Abfragen oder mit prozeduralen Mitteln erfolgen. Dies belastet
zwar stärker das Zielsystem, dennoch wird durch die eher mengen- als satzorientierten An-
fragen und die Möglichkeiten der Parallelverarbeitung von Anfragen die Verarbeitungszeit
der Transformationen verkürzt [Sun09]. In der Literatur werden diese Transformationen
auch In-Database-Integration genannt [Sub10] [Dat10, S.5]. Die Abbildung 2.16 zeigt den
theoretischen Ablauf des ELT-Prozesses. Der Ladevorgang wird dabei durch die internen
Ladewerkzeuge des Zielsystems unterstützt.
Da die operativen Daten bei der Extraktion nicht durch ein weiteres System geführt wer-
den, wie es beim ETL-Ansatz in der Regel der Fall ist, verringert dies die Netzwerklast.
Weiterhin werden beim ELT-Ansatz die vorhanden Hardwareressourcen des Zielsystems
für die Transformation genutzt, so dass keine weiteren Kosten für ein zusätzliches System
mit entsprechenden Systemanforderungen anfallen. Außerdem bietet dieses Vorgehen ei-
ne hohe Flexibilität bei gleichzeitig gesenktem Aufwand, da nur jeweils die für die jeweilige
Search WWH ::




Custom Search