Database Reference
In-Depth Information
BILD 9.16
Code Viewer anzeigen
String, der die Wörter enthält, eine zweite Spalte benötigt. Diese soll die Anzahl speichern,
wie oft ein Begriff im Datenstrom vorkommt und wird deshalb als Typ Integer, mit der Be-
zeichnung „anzahl“ angelegt. Dies geschieht unter
Edit schema
und sollte anschließend
wie in Abbildung 9.17 dargestellt, aussehen.
BILD 9.17
Spalte anzahl unter Edit Schema hinzufügen
Die Aggregation ist weitgehend selbsterklärend. Sobald das Output-Schema entsprechend
angepasst wurde, kann die Gruppierung anhand der Wörter im Feld
Group by
erfolgen.
Um die entsprechende Anzahl gleicher Wörter zu erfassen, wird im Feld Operations die
Funktion count verwendet. Danach sollte das Ergebnis Abbildung 9.18 gleichen.
BILD 9.18
Aggregation von gleichen Wörtern
Im nächsten Schritt sollen die aggregierten Worte nach ihrer Auftrittshäuigkeit sortiert
werden. Dafür wird die Komponente
tSortRow
verwendet. Die Sortierung erfolgt anhand
der hinzugefügten Spalte „anzahl“. Da es sich bei dieser um ganzzahlige Werte handelt,
muss entsprechend nummerisch sortiert werden. Für die Reihenfolge wird „desc“ gewählt,
um eine absteigende Sortierung zu erhalten (siehe Abbildung 9.19).
Da im Ergebnis nicht alle Zeilen dargestellt werden sollen, wird dem
Job
anschließend die
Komponente „tSampleRow'"hinzugefügt. In dieser steht im Reiter
Component
beschrie-
ben, wie das Weiterleiten eingeschränkter Abschnitte möglich ist. Unter
Range
kann bei-