Databases Reference
In-Depth Information
Abbildung 3-4:
Relative effort spent on specific steps in the KDDM process
(Quelle: (Kurgan/Musilek 2006, 17))
Alles in allem liefern die Schätzungen Ergebnisse, die relativ nahe beieinander sind. Insbe-
sondere auffällig ist die Tatsache, dass bei allen drei Resultaten der Aufwand für die Phase
Datenvorverarbeitung ca. 50 % beträgt. Ebenso erstaunlich ist auf den ersten Blick, dass das
eigentliche Data Mining lediglich 10 % bis 18 % der Aufwände ausmacht.
3.3.1
Das KDD-Stufenmodell von Fayyad/Piatetsky-Shapiro/Smyth
Das am weitesten verbreitete Vorgehensmodell wurde von Fayyad/Piatetsky-Shapiro/Smyth
entwickelt und erstmalig 1996 veröffentlicht (Fayyad/Piatetsky-Shapiro/Smyth 1996a, 37f.).
Als Ziel des Prozesses beschreiben die Autoren dabei die Extraktion von hochwertigem Wis-
sen (high-level knowledge) aus Basisdaten (low-level data) durch die Anwendung einer Viel-
zahl von interdisziplinären Aktivitäten. Einen Überblick über den KDD-Prozess gibt
Abbildung 3-5.
Search WWH ::




Custom Search