Knowledge Discovery in Databases im Anwendungskontext Änderungsmanagement - Knowledge Discovery in Databases

Databases Reference

In-Depth Information

Abbildung 5-41:

Prozess für das Clustern der Änderungsanträge

(Quelle: Eigene Darstellung)

Beim k-Means-Algorithmus ist zu Beginn des Berechnungsprozesses die Anzahl der Cluster

vorzugeben. Für den Test wurden exemplarisch die beiden Werte k = 10 sowie k = 15 heran-

gezogen, um etwaige Ergebnisdifferenzen beurteilen zu können. Weitere Parameterwerte wa-

ren ein zehnmaliger Durchlauf der Berechnung mit zufälliger Initialisierung sowie hundert

Optimierungsschritte in jeder Iteration 18 . Als Ergebnis des Prozesses werden 10 bzw. 15 Clus-

ter herausgegeben, die jeweils ähnliche Problembeschreibungen enthalten. Anschließend

wurden die Cluster manuell auf ihren Inhalt untersucht und wenn Ähnlichkeiten bestanden,

ihre Thematik mit einer kurzen Beschreibung notiert. Bei k = 10 wurde ein Cluster mit ge-

setzlichen Vorschriften und eines mit unterschiedlichen Problemen hinsichtlich der Türkon-

struktion identifiziert. Ähnlich sah es bei k = 15 aus, wobei hier zusätzlich Cluster mit

Werkstoffthemen, Korrosionsproblemen sowie Problemen im Zusammenhang mit der B-

Säule des Fahrzeugs berechnet wurden.

Zur Berechnung der Ergebnisse mit dem k-Medoids-Algorithmus wurden die gleichen Para-

meterwerte für k, für die Anzahl der Iterationen und für die Optimierungsschritte gewählt. Im

Gegensatz zu der schnellen k-Means-Berechnung benötigt diese Berechnung jedoch 160 Mal

mehr Zeit. Vergleicht man die Ergebnisse für k = 10 so ist zu sehen, dass der Algorithmus

zwei neue Cluster berechnen konnte (siehe Tabelle 5-8). Das erste Cluster besteht aus Anträ-

gen, welche Abdichtungsprobleme der A-und B-Säule thematisieren. Das zweite Cluster be-

18 Der Ablauf zur Berechnung der Cluster ist für die verwendeten Methoden in Kapitel 3.5.2.1 be-

schrieben.

Search WWH ::

Custom Search

Home