Database Reference
In-Depth Information
strukturelle Transformationen - Homogenisierung und Konsolidierung im Hinblick auf
Modellierungsebenen, Schlüsselwerte, Constraints, Standards usw., z. B. Aulösen aller
Wertelisten in eigene Tabellen, Ersetzen von Schlüsselwerten mit kodierten Informatio-
nen durch sequentielle Werte, Vereinheitlichen von Vorschriften usw.
semantische Transformationen - Homogenisierung und Konsolidierung im Hinblick
auf Benennungen, Bemaßungen, verwendete Skalen usw., z. B. Vereinheitlichung aller
Längenmaße auf Meter, aller Währungswerte auf Euro, aller Varianten für Anrede oder
Geschlecht auf „m“ und „w“ usw.
Im Abschnitt 2.6 werden die häuigsten Transformationen ausführlicher beschrieben und
im Abschnitt 5.3 auf das Beispielszenario angewendet.
Viele Transformationen können bereits während der Extraktion mit Hilfe von Datenbank-
mitteln (Structured Query Language (SQL)-Abfragen) stattinden. So können z. B. durch ei-
ne entsprechende Abfrage unter Verwendung der Funktion REPLACE die im Quellsystem
als Anrede hinterlegten Werte „Herr“ und „Frau“ als die Werte „m“ (männlich) und „w“
(weiblich) für Geschlecht in den Arbeitsbereich übertragen werden. Durch einfache Da-
tenkonvertierungsfunktionen können Datentypen aus dem Quellsystem, die nicht für das
Zielsystem geeignet sind oder dort nicht unterstützt werden, bereits beim Extrahieren um-
gewandelt werden. Etwas aufwendiger, aber ebenfalls mit Datenbankmitteln möglich, ist
die Abbildung von Regeln, die in Quell- und Zielsystem verschieden sind. Hier kann ent-
weder die Funktion CASE zum Einsatz kommen oder es werden prozedurale Hilfsmittel
(Ablaufsteuerung mit if-else) verwendet.
Dieses Vorgehen ist nach [LN07, S.384] oftmals efizienter, da die Daten bereits in transfor-
mierter Form dem Arbeitsbereich hinzugefügt werden. Durch den Einsatz von ETL-Tools
können diese Aktionen unterstützt werden. Diese bieten zahlreiche Möglichkeiten, die ex-
trahierten Daten mit vorgefertigten Transformationskomponenten zu verarbeiten. Der Be-
nutzer wählt dazu aus einem entsprechenden Katalog die gewünschten Komponenten, die
er auf einer graischen Oberläche entsprechend der zuvor entworfenen Transformations-
schritte anordnet und miteinander verbindet. Im Hintergrund werden daraus die entspre-
chenden Anfragen an die Datenbank generiert. Darüber hinaus ist es mit einem ETL-Tool
recht einfach möglich Daten aus den Quellsystemen mit Informationen aus externen Quel-
len anzureichern, z. B. um fehlende Werte zu ergänzen oder existierende Werte zu konso-
lidieren. Damit können Plausibilitätskontrollen durchgeführt und die Qualität der Daten
sichergestellt werden.
2.5.1.3 Laden
Wenn alle benötigten Daten extrahiert und transformiert sind, stehen sie nun für das La-
den in die Zieldatenbank bereit. Dabei werden die Daten dauerhaft im Zielsystem gespei-
chert. Auch für diesen Prozess stehen Bordmittel der Datenbank zur Verfügung, z. B. spe-
zielle Bulk-Load -Verfahren, die über entsprechend formatierte Textdateien die Befüllung
der Ziel-Tabellen gewährleisten. ETL-Tools können die Befüllung der Zieldatenbank eben-
falls unterstützen, indem sie die geeigneten Komponenten bieten, die den erforderlichen
Programmcode generieren.
Das Laden der Daten in die Zieldatenbank kann ebenfalls ein langwieriger Prozess sein, je
nach Menge und Komplexität der zu ladenden Daten. Am aufwendigsten ist das sogenann-
te initiale Laden, bei dem die Daten erstmalig in das Zielsystem übertragen werden. Später
Search WWH ::




Custom Search