Databases Reference
In-Depth Information
Als Ergebnis erhält man nach Auswertung der Interviews ein detailliertes Bild der
Ursachen und Auswirkungen verschiedener DQ-Probleme im Umfeld der unter-
suchten Komponenten. Man erhält ein gutes Verständnis der vorliegenden Prob-
leme, deren Ursache und Wirkung in Bezug auf die Unternehmens-KPI. Zudem
kann bereits in groben Zügen definiert werden, welche Maßnahmen zur Verbesse-
rung der DQ-Probleme getroffen werden müssen. Es entstehen also Projektbe-
schreibungen, die noch im Rahmen von Phase 4 weiter verfeinert werden müssen.
5.5.4 Phase 4 - Validieren und Quantifizieren
Nachdem bekannt ist von welchen Problemen die verschiedenen Komponenten
betroffen sind, muss dies nun in Phase 4 validiert und die Größe des Effekts ge-
messen werden. Es kann z.B. vorkommen, dass bestimmte Probleme den Befragten
durchaus wichtig erscheinen, bzw. in deren Erinnerung sich eingeprägt haben, der
Fall jedoch vielleicht überhaupt nur einmal oder sehr selten eingetroffen ist. Mani-
festiert sich hingegen ein relativ harmlos erscheinender Fehler sehr häufig, so kann
dies einen großen negativen Einfluss auf die Unternehmens-KPI haben.
Phase 4 hilft also, die „Größe des Eisbergs zu schätzen“. Bislang konnte man nur
dessen aus dem Wasser herausragende Spitze und seine groben Umrisse unter
Wasser sehen, ohne jedoch sein Gesamtvolumen zu kennen. Dies wird im Falle der
DQ erreicht indem die Daten im Detail auf ihre Fehlerhaftigkeit hin untersucht
werden.
Zunächst erfolgt die Validierung der geschilderten Probleme: kann man in den
Datenbanken oder Applikationen die genannten Probleme finden bzw. nachvoll-
ziehen?
Dann wird ermittelt, wie häufig die Probleme auftauchen. Im Falle der Kunden-
dubletten wird z.B. ermittelt wie viele sich tatsächlich im System befinden. Es kann
durchaus sein, dass man für die Abschätzung der Problemgröße auf statistische
Hochrechnungen zurückgreifen muss, da die detaillierte Analyse der Fehler nur
auf kleineren Teilmengen der gesamten Daten überhaupt möglich ist.
Dabei werden Analyseverfahren eingesetzt, die von einfacher deskriptiver Statistik
bis hin zu komplexen Data Mining Verfahren gehen können. Einige einfache Bei-
spiele spiegelt Abb. 7 wider.
Search WWH ::




Custom Search