Databases Reference
In-Depth Information
Abbildung 5-41:
Prozess für das Clustern der Änderungsanträge
(Quelle: Eigene Darstellung)
Beim k-Means-Algorithmus ist zu Beginn des Berechnungsprozesses die Anzahl der Cluster
vorzugeben. Für den Test wurden exemplarisch die beiden Werte
k = 10
sowie
k = 15
heran-
gezogen, um etwaige Ergebnisdifferenzen beurteilen zu können. Weitere Parameterwerte wa-
ren ein zehnmaliger Durchlauf der Berechnung mit zufälliger Initialisierung sowie hundert
Optimierungsschritte in jeder Iteration
18
. Als Ergebnis des Prozesses werden 10 bzw. 15 Clus-
ter herausgegeben, die jeweils ähnliche Problembeschreibungen enthalten. Anschließend
wurden die Cluster manuell auf ihren Inhalt untersucht und wenn Ähnlichkeiten bestanden,
ihre Thematik mit einer kurzen Beschreibung notiert. Bei
k = 10
wurde ein Cluster mit ge-
setzlichen Vorschriften und eines mit unterschiedlichen Problemen hinsichtlich der Türkon-
struktion identifiziert. Ähnlich sah es bei
k = 15
aus, wobei hier zusätzlich Cluster mit
Werkstoffthemen, Korrosionsproblemen sowie Problemen im Zusammenhang mit der B-
Säule des Fahrzeugs berechnet wurden.
Zur Berechnung der Ergebnisse mit dem k-Medoids-Algorithmus wurden die gleichen Para-
meterwerte für k, für die Anzahl der Iterationen und für die Optimierungsschritte gewählt. Im
Gegensatz zu der schnellen k-Means-Berechnung benötigt diese Berechnung jedoch 160 Mal
mehr Zeit. Vergleicht man die Ergebnisse für
k = 10
so ist zu sehen, dass der Algorithmus
zwei neue Cluster berechnen konnte (siehe Tabelle 5-8). Das erste Cluster besteht aus Anträ-
gen, welche Abdichtungsprobleme der A-und B-Säule thematisieren. Das zweite Cluster be-
18
Der Ablauf zur Berechnung der Cluster ist für die verwendeten Methoden in Kapitel 3.5.2.1 be-
schrieben.