Database Reference
In-Depth Information
• Messfehler bei automatischer Datenerfassung
Z.B. Barcodescanner, Messinstrumente, Schrifterkennungsalgorithmen.
Grund hierfür sind teilweise technische Grenzen, teilweise jedoch auch
bewusst in Kauf genommene Fehler, z.B. aufgrund von Kostenaspek-
ten.
2. Alterung
Im Laufe der Zeit können auch ursprünglich korrekte Daten veralten und da-
mit inkorrekt werden (z.B. Adresse nach einem Umzug oder Aktienkurse).
3. Transformation
Daten werden zur besseren Auswertung häufig transformiert, z.B. Umrech-
nung von Werten in andere Maßeinheiten. Fehler entstehen hierbei durch
fehlerhafte Umrechnungswerte (z.B. fehlerhafte Wechselkurse).
4. Integration
Bei der Integration von Daten kommt es aufgrund der Autonomie der Quel-
len häufig zu Duplikaten. Weiteres Problem bei der Integration sind Kon-
flikte in den Duplikaten, d.h. die Informationen über ein Realwelt-Objekt
widersprechen sich.
Auswirkungen von Duplikaten
Betrachtet man die Auswirkungen von Duplikaten aus wirtschaftlicher Sicht, so
ergeben sich eine Vielzahl negativer Konsequenzen. So können Kunden mit ei-
ner schlechten Zahlungshistorie ggf. weitere Waren bestellen, da sie eine neue
Kundennummer erhalten haben. Im Rahmen von Marketing-Kampagnen ergeben
sich einerseits zusätzliche Portokosten, andererseits erleidet ein Unternehmen auch
einen Imageschaden, wenn es Kunden mehrfach anschreibt. Abgesehen von Kun-
dendaten, entstehen auch Probleme wenn sich Duplikate in Produktdaten befinden.
Ist ein Produkt mit mehreren Produkt-Identifizierern enthalten, wird es ggf. einge-
kauft, obwohl es noch im Lager vorhanden ist bzw. es wird mehrfach eingekauft
ohne Mengenrabatte zu nutzen.
Neben den wirtschaftlichen Auswirkungen existieren jedoch auch IT-technische
Auswirkungen durch nicht erkannte Duplikate: 16 :
• Die Anzahl der Realwelt-Objekte kann nicht durch einfaches Zählen ermit-
telt werden, sondern liegt unter der Gesamt-Menge an Objekten in einem
Datenbestand.
16 vgl. [8], S. 129ff.
Search WWH ::




Custom Search