Ausblick - Datenintegration

Database Reference

In-Depth Information

BILD 9.16 Code Viewer anzeigen

String, der die Wörter enthält, eine zweite Spalte benötigt. Diese soll die Anzahl speichern,

wie oft ein Begriff im Datenstrom vorkommt und wird deshalb als Typ Integer, mit der Be-

zeichnung „anzahl“ angelegt. Dies geschieht unter Edit schema und sollte anschließend

wie in Abbildung 9.17 dargestellt, aussehen.

BILD 9.17 Spalte anzahl unter Edit Schema hinzufügen

Die Aggregation ist weitgehend selbsterklärend. Sobald das Output-Schema entsprechend

angepasst wurde, kann die Gruppierung anhand der Wörter im Feld Group by erfolgen.

Um die entsprechende Anzahl gleicher Wörter zu erfassen, wird im Feld Operations die

Funktion count verwendet. Danach sollte das Ergebnis Abbildung 9.18 gleichen.

BILD 9.18 Aggregation von gleichen Wörtern

Im nächsten Schritt sollen die aggregierten Worte nach ihrer Auftrittshäuigkeit sortiert

werden. Dafür wird die Komponente tSortRow verwendet. Die Sortierung erfolgt anhand

der hinzugefügten Spalte „anzahl“. Da es sich bei dieser um ganzzahlige Werte handelt,

muss entsprechend nummerisch sortiert werden. Für die Reihenfolge wird „desc“ gewählt,

um eine absteigende Sortierung zu erhalten (siehe Abbildung 9.19).

Da im Ergebnis nicht alle Zeilen dargestellt werden sollen, wird dem Job anschließend die

Komponente „tSampleRow'"hinzugefügt. In dieser steht im Reiter Component beschrie-

ben, wie das Weiterleiten eingeschränkter Abschnitte möglich ist. Unter Range kann bei-

Search WWH ::

Custom Search

Home