Databases Reference
In-Depth Information
5.4
Methodisches Vorgehen zur Gestaltung des Analyseprozesses
Nachdem die domänenspezifischen Gegebenheiten erhoben wurden, hat die weitere Analyse
der Struktur der Daten ein Verständnis über deren Aufbau geschaffen. Dies wurde in regel-
mäßigen Diskussionen sowie im Workshop genutzt, um relevante Fragestellungen als Ziel der
Datenanalysen zu erhalten. In den folgenden Abschnitten werden nun durch die Anwendung
verschiedener Methoden die relevanten Fragestellungen beantwortet. Das Vorgehen orientiert
sich dabei an dem in Kapitel 3.3.1 beschriebenen Modell von Fayyad/Piatetsky-
Shapiro/Smyth (1996a, 42), nach dem zunächst die Daten gesichtet und selektiert werden,
eine Vorverarbeitung und Transformation dieser vorgenommen wird sowie entsprechende
Data Mining-Methoden angewendet werden. Die Analysen sind anhand der Themenkomplexe
strukturiert, welche zur Kategorisierung der Fragestellungen genutzt wurden.
Bei der Darstellung der jeweiligen Analysen werden zunächst die Thematik und die daraus
resultierende Fragestellung erörtert. Dem folgen mitunter grundlegende Erkenntnisse, die be-
reits zu diesen Fragen in der Forschung erzielt wurden. In einem nächsten Schritt werden mit-
unter Hypothesen aufgestellt die darstellen, welchen Nutzen die aus den Daten gezogenen
Kenntnisse bringen können. Es folgt eine beschreibende Darstellung der für die Analysen
genutzten Daten, des Analyseprozesses, eine Beschreibung der strukturellen Ergebnisse sowie
eine kurze einführende Interpretation der auffälligen Resultate.
5.5
Themenkomplex statistische Analysen
Unter dem Themenkomplex statistische Analysen sind alle Fragestellungen zusammengefasst,
bei denen im Mining-Prozess hauptsächlich deskriptive Verfahren der Statistik angewendet
wurden. Diese Untersuchungen ermöglichen, einen ersten Überblick über das mengenmäßige
Aufkommen aus verschiedenen Gesichtspunkten zu erlangen. Hierbei hat sich als einer der
Vorteile gezeigt, dass die Methoden des Data Mining eine standardisierte Da-
ten(vor)verarbeitung und Berechnung ermöglichen, die bei herkömmlichen Vorgehensweisen
nicht unter den vorliegenden Randbedingungen (großer Datensatz, gewünschte Rechenzeit
usw.) erfüllbar wären.
5.5.1
Häufigkeitsanalyse von Änderungsanträgen im Zeitverlauf
Zu Beginn der Untersuchungen helfen Fragen über mengenmäßige Verteilungen von Ände-
rungen, einen Eindruck über die durchgeführten und dokumentierten Änderungen zu bekom-
men. Bei dieser ersten Fragestellung geht es um die Analyse der Häufigkeiten von Anträgen.
Der vorliegende Datensatz enthält Änderungsanträge über einen Zeitraum von fünf Jahren,
also vom Beginn des Managements und der Dokumentation der Änderungen im dafür vorge-
sehenen IT-System. Die hier betrachtete erste Fragestellung aus Tabelle 5-1 behandelt die
zeitliche Verteilung von Änderungen, die den Prozess im Sinne der Genehmigung erfolgreich
und nicht erfolgreich durchlaufen haben.
Aus Sicht der Entwicklungsperspektive sind statistische Betrachtungen über Trends und Häu-
fungen hinsichtlich der Anzahl der durchgeführten und in der Zukunft durchzuführenden
Search WWH ::




Custom Search