Databases Reference
In-Depth Information
um aufgestellte oder vermutete Hypothesen zu überprüfen. Im Gegensatz zu Fallstudien und
anderen Forschungsmethoden, bei denen Einzelfallanalysen durchgeführt werden um auf das
Ganze schließen zu können, basieren die Ausführungen in dieser Arbeit auf Untersuchungen
von einer ganzen Reihe von Fällen. Fernerhin werden dadurch Analysen ermöglicht, bei de-
nen Daten aus verschiedenen Perspektiven untersucht werden.
Mit Hilfe der Beantwortung unterschiedlicher Fragestellungen wurden bislang vermutete
Strukturen und Zusammenhänge überprüft. Demungeachtet ist offenkundig, dass weitere noch
unbekannte Muster und Wechselbeziehungen zu erforschen sind und mit Hilfe der Methoden
des KDD identifiziert werden müssen. Sie helfen auch, Ursachen für Verläufe und Zusam-
menhänge zu erklären. In diesem Zuge ist die Nutzung der Ergebnisse als Prognosewerkzeug
zu überprüfen, bei dem aus Erfahrungswerten Voraussagen für neue Fälle und Daten getroffen
werden. Dabei hilft die bei dieser Arbeit genutzte Analyse von Texten, die in Kombination
mit strukturierten Daten ausgewertet wurden.
Deutlich wird, dass die Integration von Datenanalyseverfahren in den Entwicklungsprozess
nutzenbringend ist. Wichtig ist jedoch, eine den Anforderungen entsprechende Integration des
KDD in den Produktentwicklungsprozess und in das Änderungsmanagement zu gewährleis-
ten. In diesem Zuge müssen weitere (teil-)automatisierte Analyseprozesse modelliert werden,
die zu Standards ausgebaut werden sollten. Wissen darüber, welche Daten für die Analyse
notwendig sind und welche weiteren erhoben und dokumentiert werden müssen, ist ebenso
wichtig, wie die Einbeziehung der sich ergebenden Anforderungen im KDD-Prozess in zu-
künftige IT-Entwicklungen in der Produktentwicklung.
Domäne Knowledge Discovery in Databases
Aus Sicht des Knowledge Discovery in Databases repräsentiert diese Arbeit die umfassende
Anwendung des Vorgehens in einem neuen Anwendungskontext. Dabei wurde im Zusam-
menhang aktueller Forschungsvorhaben und der Literatur deutlich, dass eine stärkere Einbe-
ziehung des Business Understandings zu Beginn der Datenanalysen von großem Nutzen ist
(vgl. dazu Cao (2010)). Aus diesem Grunde wurde die Entwicklung sowie die Anwendung
eines Frameworks für das Domain Driven Data Mining in Kapitel 3.8 dargestellt, deren Ver-
wendbarkeit und Zweckmäßigkeit für andere Anwendungsfälle zu überprüfen ist. Der im
Framework herausgearbeitete Methodenmix zur Domänenanalyse kann in weiteren und neuen
Anwendungsfällen angepasst werden, und ist dadurch als flexibler Bestandteil offen für wei-
tere aus Forschungssicht notwendige Erweiterungen.
Die in dieser Arbeit angewendeten Methoden des Data Mining und des Text Mining haben zu
neuartigen Erkenntnissen geführt, die mit herkömmlichen Mitteln der Statistik nicht abgeleitet
werden können. Bei den textuellen Analysen hat sich herausgestellt, dass trotz vieler Mög-
lichkeiten zur automatisierten Verarbeitung und Prüfung der Daten die Methoden an einigen
Stellen ihre Grenzen erreichen. Hier ist es teilweise notwendig gewesen, anhand manueller
Arbeiten die gewünschten Ergebnisse zu erreichen, die durch eine automatisierte Bearbeitung
schneller in kürzerer Zeit möglich wären. Hinsichtlich des Vorgehensmodells von
Fayyad/Piatetsky-Shapiro/Smyth (1996a) ist zu prüfen, inwiefern die Anwendung eines fina-
Search WWH ::




Custom Search