Databases Reference
In-Depth Information
liertes Vorgehen, welches eine erweiterte Anleitung für die verschiedenen Aufgaben gibt. Es
decket insbesondere alle Aspekte zu Beginn eines Data Mining-Projekts ab. Die Methodik ist
im Sinne eines hierarchischen Modells beschrieben, das aus Gruppen von Aufgaben auf vier
Abstraktionsebenen (vom Allgemeinen zum Spezifischen) beschrieben wird. Diese Ebenen
reichen dabei von der Phase, über die generische Aufgabe, hin zum spezialisierten Task und
letztendlich zur Prozess-Instanz (Chapman et al. 2000, 9). Auf der ersten Ebene wird das
Vorgehen in Data Mining-Vorhaben als sechsstufiges Phasenmodell, welches die Schritte
Business Understanding , Data Understanding , Data Preparation , Modelling , Evaluation und
Deployment enthält (siehe Abbildung 3-7), dargestellt (vgl. auch Clifton/Thuraisingham
(2001, 191)). Anwendungen des Modells in unterschiedlichen Domänen für verschiedene
Zwecke werden von Adderley/Townsley/Bond (2007, 172), Cespivová et al. (2004, 2) und
Chen/Huang (2011, 5360) vorgestellt.
Business
Understanding
Data
Understanding
Data
Preparation
Deployment
Data
Modeling
Evaluation
Abbildung 3-7:
Phasen des CRISP-DM Referenzmodells
(Quelle: (Chapman et al. 2000, 13))
Die Abfolge der Phasen muss nicht starr eingehalten werden. Oft sind Vor- als auch Rück-
sprünge zwischen einzelnen Schritten erforderlich, und zwar abhängig von der Ergebnisquali-
tät der bereits ausgeführten Phase. Die einzelnen Phasen wiederum beinhalten Aufgaben, die
als generisch bezeichnet werden, da beabsichtigt ist, allgemein mögliche Situationen weitge-
Search WWH ::




Custom Search