Databases Reference
In-Depth Information
Abbildung 5-41:
Prozess für das Clustern der Änderungsanträge
(Quelle: Eigene Darstellung)
Beim k-Means-Algorithmus ist zu Beginn des Berechnungsprozesses die Anzahl der Cluster
vorzugeben. Für den Test wurden exemplarisch die beiden Werte k = 10 sowie k = 15 heran-
gezogen, um etwaige Ergebnisdifferenzen beurteilen zu können. Weitere Parameterwerte wa-
ren ein zehnmaliger Durchlauf der Berechnung mit zufälliger Initialisierung sowie hundert
Optimierungsschritte in jeder Iteration 18 . Als Ergebnis des Prozesses werden 10 bzw. 15 Clus-
ter herausgegeben, die jeweils ähnliche Problembeschreibungen enthalten. Anschließend
wurden die Cluster manuell auf ihren Inhalt untersucht und wenn Ähnlichkeiten bestanden,
ihre Thematik mit einer kurzen Beschreibung notiert. Bei k = 10 wurde ein Cluster mit ge-
setzlichen Vorschriften und eines mit unterschiedlichen Problemen hinsichtlich der Türkon-
struktion identifiziert. Ähnlich sah es bei k = 15 aus, wobei hier zusätzlich Cluster mit
Werkstoffthemen, Korrosionsproblemen sowie Problemen im Zusammenhang mit der B-
Säule des Fahrzeugs berechnet wurden.
Zur Berechnung der Ergebnisse mit dem k-Medoids-Algorithmus wurden die gleichen Para-
meterwerte für k, für die Anzahl der Iterationen und für die Optimierungsschritte gewählt. Im
Gegensatz zu der schnellen k-Means-Berechnung benötigt diese Berechnung jedoch 160 Mal
mehr Zeit. Vergleicht man die Ergebnisse für k = 10 so ist zu sehen, dass der Algorithmus
zwei neue Cluster berechnen konnte (siehe Tabelle 5-8). Das erste Cluster besteht aus Anträ-
gen, welche Abdichtungsprobleme der A-und B-Säule thematisieren. Das zweite Cluster be-
18 Der Ablauf zur Berechnung der Cluster ist für die verwendeten Methoden in Kapitel 3.5.2.1 be-
schrieben.
Search WWH ::




Custom Search