Database Reference
In-Depth Information
2.6.2.3 Schema-Angleichung
Auf der Grundlage der Korrespondenz- oder/und Konliktanalyse müssen nun Vorschriften
und Regeln abgeleitet werden, die es ermöglichen, die Daten der Quellsysteme konliktfrei
zusammenzuführen bzw. in ein Zielsystem zu überführen. Die wichtigsten Teilaufgaben,
die zu bearbeiten sind, werden in diesem Abschnitt dargestellt. Die zu lösenden Aufgaben
entsprechen den Vorbereitungen zum Schritt „Transformation“ im ETL-Prozess und sind
in der entsprechenden Literatur, z. B. [BG04] noch ausführlicher beschrieben.
Vereinheitlichung der Benennungen
In den wenigsten Fällen werden die zu fusionierenden oder zu mappenden Systeme ein-
heitliche Benennungen für gleiche Sachverhalte aufweisen. Vielmehr hat man es oft mit
Synonymen, Homonymen, Akronymen und Abkürzungen zu tun. Beim Mapping sind die
Struktur und damit auch die Benennungen des Zielschemas vorgegeben, daher besteht in
diesem Fall die größte Herausforderung darin, die zusammengehörenden Konzepte (z. B.
Kunden. Lieferanten, Bestellungen usw.) zu inden, diese einander zuzuordnen und Regeln
zu inden, um die benötigten Elemente der Quellen in das Zielsystem zu überführen. Bei
der Fusion steht natürlich ebenfalls das Finden zusammengehörender Konzepte im Vor-
dergrund. Darüber hinaus müssen geeignete Benennungen für das Zielsystem gefunden
und festgelegt werden.
Vereinheitlichung der Datentypen
Diese Aufgabe muss vor allem dann bewältigt werden, wenn die Quellsysteme oder auch
das Zielsystem unterschiedliche Datenbankmanagementsysteme nutzen bzw. weitere Da-
tenquellen wie z. B. CSV-Dateien, Excel-Tabellen o. Ä. einbezogen werden müssen. Pro-
prietäre Datentypen sollten zunächst in solche Standarddatentypen umgewandelt werden,
die den wenigsten Informationsverlust bedeuten. Im Extremfall kann ein Zwischenschritt
sinnvoll sein, bei dem zunächst alle Daten in Zeichenketten umgewandelt werden, um erst
im Ziel in den jeweils geforderten bzw. sinnvollen Datentyp konvertiert zu werden. Die
meisten Datenbanksysteme bieten dafür komfortable Konvertierungsfunktionen an.
Vereinheitlichung der Nulloption
Unterscheiden sich die Quellsysteme bzw. Quell- und Zielsystem hinsichtlich der festgeleg-
ten Nulloption für ein Attribut, sind zwei Wege denkbar. Zum einen kann überprüft werden
(z. B. durch Nachfrage bei der Fachabteilung), ob ein Not Null-Constraint wirklich unbe-
dingt erforderlich ist. Falls nicht, kann das Attribut als nullfähig betrachtet werden und es
werden später nur die existierenden Werte aus den Quellen übertragen. Falls dies nicht
erlaubt ist, sollte ein geeigneter Standardwert deiniert werden, um abzusichern, dass für
fehlende Quellwerte ein einheitlicher Wert in das Zielsystem übertragen wird.
Vereinheitlichung der Standardwerte
Gibt es bereits Standardwerte in den verschiedenen Quellsystemen bzw. im Ziel und un-
terscheiden sich diese, ist die Aufgabe etwas aufwendiger In diesem Fall ist es sinnvoll, die
verschiedenen Standardwerte als Liste in einem CHECK-Constraint vorzugeben und einen
Search WWH ::




Custom Search