Database Reference
In-Depth Information
Für den zu erstellenden
Job
werden die Komponenten tMap, tMSSqlInput, tMSSqlOutput
(siehe Abschnitt 7.3) sowie tMySqlInput (Abschnitt 8.1.2) und tFileOutputExcel (Abschnitt
8.2.5) verwendet. Zusätzlich werden die Komponenten
tConvertType
,
tReplicate
und
tJoin
sowie ein neuer Output-Typ eingeführt.
tJoin
Die Komponente
tJoin
verknüpft zwei Tabellen mit Hilfe ei-
ner oder mehreren Spalten miteinander. Es vergleicht Spalten aus dem
Hauptdatenstrom mit Spalten aus dem Referenzdatenstrom und fügt
diese zu einem Ausgabedatenstrom zusammen. Damit können in Be-
ziehung stehende Tabellen mit einem Join verknüpft werden wie dies
schon aus SQL-Statements bekannt ist.
tJoin
bietet dabei die Möglich-
keit einen
left outer join
oder einen
inner join with reject output
durch-
zuführen. Letzteres gibt alle Datensätze, welche nicht verknüpft werden
konnten, in einem extra Datenstrom aus.
tReplicate
tReplicate
dupliziert einen Datenstrom in zwei identische
Ausgabedatenströme. Es benötigt eine Input-Komponente und min-
destens eine Output-Komponente. Durch diesen Baustein ist es mög-
lich, verschiedene Operationen auf dem gleichen Schema durchzufüh-
ren.
tConvertType
Mit Hilfe von
tConvertType
können speziische Daten-
formatveränderungen zur Laufzeit durchgeführt werden. Es ermöglicht
die Konvertierung von Java Datentypen in anderen Java Datentypen, er-
möglicht so die Übertragung in das neue Schema und vermeidet Fehler
beim Compilieren.
In diesem
Job
werden zunächst mit der
tMySqlInput
-Komponente namens „Mysel_Ver-
mietung“ die Daten aus der Tabelle „Vermietung“ ausgelesen. Die Daten werden danach an
die
tReplicate
-Komponente, welche in der
Palette
unter
Orchestration
gefunden und unter
bekanntem Wege dem Arbeitsbereich hinzugefügt werden kann, übergeben. Diese gene-
riert aus dem Input-Datenstrom zwei Output-Datenströme. Hierbei können entweder alle
oder nur bestimmte Attribute des Eingangsdatenstromes an die beiden Ausgangsdaten-
ströme weitergegeben werden. Um alle Attribute weiterzuleiten, genügt ein
Klick
auf den
Sync columns
-Button. Um nur bestimmte Attribute weiterzuleiten, öffnet man mit einem
Klick auf den
three-dot-button
das Auswahlfenster, wählt alle relevanten Attribute aus und
fügt diese so dem Ausgabedatenstrom hinzu. Die beiden Output-Datenlusspfeile können
ohne Beachtung der Reihenfolge nacheinander von der
tReplicate
-Komponente zu den fol-
genden Bausteinen gezogen werden.
Im Beispielszenario werden alle vorhandenen Attribute mit dem
Sync columns
-Button aus-
gewählt und weitergegeben. Der nach rechts abgehende Datenluss (siehe Abbildung 8.41)
verweist dabei in den Zweig, welcher zum Auslesen aller Vermietungen ohne Rechnung
dient. Der nach links abgehende Datenluss gibt die Daten an den Zweig weiter, der die
Integration aller Vermietungen in das Zielsystem durchführt. Dieser soll zuerst betrachtet
werden.