Database Reference
In-Depth Information
BILD 9.16 Code Viewer anzeigen
String, der die Wörter enthält, eine zweite Spalte benötigt. Diese soll die Anzahl speichern,
wie oft ein Begriff im Datenstrom vorkommt und wird deshalb als Typ Integer, mit der Be-
zeichnung „anzahl“ angelegt. Dies geschieht unter Edit schema und sollte anschließend
wie in Abbildung 9.17 dargestellt, aussehen.
BILD 9.17 Spalte anzahl unter Edit Schema hinzufügen
Die Aggregation ist weitgehend selbsterklärend. Sobald das Output-Schema entsprechend
angepasst wurde, kann die Gruppierung anhand der Wörter im Feld Group by erfolgen.
Um die entsprechende Anzahl gleicher Wörter zu erfassen, wird im Feld Operations die
Funktion count verwendet. Danach sollte das Ergebnis Abbildung 9.18 gleichen.
BILD 9.18 Aggregation von gleichen Wörtern
Im nächsten Schritt sollen die aggregierten Worte nach ihrer Auftrittshäuigkeit sortiert
werden. Dafür wird die Komponente tSortRow verwendet. Die Sortierung erfolgt anhand
der hinzugefügten Spalte „anzahl“. Da es sich bei dieser um ganzzahlige Werte handelt,
muss entsprechend nummerisch sortiert werden. Für die Reihenfolge wird „desc“ gewählt,
um eine absteigende Sortierung zu erhalten (siehe Abbildung 9.19).
Da im Ergebnis nicht alle Zeilen dargestellt werden sollen, wird dem Job anschließend die
Komponente „tSampleRow'"hinzugefügt. In dieser steht im Reiter Component beschrie-
ben, wie das Weiterleiten eingeschränkter Abschnitte möglich ist. Unter Range kann bei-
Search WWH ::




Custom Search