Databases Reference
In-Depth Information
Verfügung stellt. In diesem Kapitel wurden aus diesem Motiv heraus zunächst die Grundla-
gen durch die Aufarbeitung der relevanten Definitionen sowie durch die Abgrenzung des For-
schungsbereichs von verwandten Gebieten dargestellt.
Die Interdisziplinarität der Thematik zeichnet sich unter anderem durch die Nähe zum Wis-
sensmanagement, der Künstlichen Intelligenz, dem Information Retrieval und der Computer-
linguistik aus. Viele der im KDD verwendeten Vorgehensweisen haben ihren Ursprung unter
anderem in einem dieser Fachgebiete und haben sich bei den Datenanalysen strukturell und
methodisch als nutzenbringend erwiesen.
Einen Schwerpunkt in Kapitel 3 bilden Vorgehensmodelle für das KDD. Auf Basis von in-
haltlichen Gegenüberstellungen wurde ermittelt, dass sich die gängigen Vorgehensmodelle
auf vier Prozessschritte reduzieren lassen: (Daten-)Vorbereitung , Datenvorverarbeitung , Me-
thodenanwendung und Ergebnisinterpretation . Dies lässt sich auch auf die für diese Arbeit
wichtigen und für den Forschungsablauf genutzten Modelle von Fayyad/Piatetsky-
Shapiro/Smyth (1996a) und Chapman et al. (2000) übertragen, die mit ihren Phasen einge-
hend dargestellt wurden.
Weiterhin wurde aufgezeigt, welche unterschiedlichen Gruppen von Data Mining- und Text
Mining-Methoden existieren sowie unterschiedliche Definitionen betrachtet. Die Methoden
des Data Mining wurden in Klassenbildungsverfahren, Klassifizierungsmethoden und Metho-
den der Assoziationsanalyse eingeordnet. Beim Text Mining wurden die für diese Arbeit rele-
vanten Möglichkeiten bei der Dokumentenauswahl, der Dokumentenvorverarbeitung und der
Dokumententransformation beschrieben.
Da Software eine entscheidende Rolle bei den Datenanalysen spielt, wurden auf Basis von
Literatur aktuell eingesetzte Werkzeuge des KDD ermittelt und anhand von intersubjektiv
nachvollziehbaren Kriterien miteinander verglichen. Dadurch konnte die Auswahl für das in
dieser Forschungsarbeit verwendete System begründet werden.
Abschließend wurden die Anforderungen von Domain Driven Data Mining dargelegt. Da in
der Literatur relativ wenig in Bezug auf geeignete Vorgehensweisen veröffentlich ist, wurde
im Zuge dieser Arbeit ein Framework entwickelt, welches als Hauptbestandteile den NDA,
die FODA sowie empirischen Forschungsmethoden beinhaltet. Dieses wird bei der im folgen-
den Kapitel dargestellten empirischen Analyse verwendet. Insgesamt konnte dadurch ein wei-
terer Baustein zur Beantwortung der ersten Forschungsfrage erarbeitet und ein
domänengetriebener KDD-Prozess sichergestellt werden. Weiterhin dienen die Arbeiten zu
den Methoden des Data Mining und Text Mining dazu, eine Basis für die Beantwortung der
zweiten Forschungsfrage - nämlich der Beurteilung der Eignung der Methoden im Anwen-
dungskontext Änderungsmanagement - zu legen.
Search WWH ::




Custom Search