Databases Reference
In-Depth Information
- Das mehrfache Anschreiben von Interessenten kann außer zu erhöhten Pro-
duktions- und Versandkosten auch zu mehrfacher Gewährung von Rabatten
oder gar zur Verärgerung des Kunden wegen uneinheitlicher oder gar un-
passender Kundenansprache führen.
- Fehleinschätzung von Kunden, deren Umsätze sich auf mehrere Datensätze
verteilen.
Neben höheren Kosten ist - in der Außenwirkung - mit Dubletten meist auch ein
Verlust an Reputation verbunden, der sich in einer Minderung von Umsatzchan-
cen niederschlagen kann. Um beides zu vermeiden, müssen Dubletten entdeckt
und entfernt werden.
5.2.2 Entstehung von Dubletten
Eine bedeutende Eigenschaft von Dubletten ist, dass sie zwar dasselbe Objekt re-
präsentieren, die einzelnen Dubletten sich aber in einigen Datenfeldern durch un-
terschiedliche Werte voneinander unterscheiden. Vor allem in den Werten, durch
die das Objekt eindeutig beschrieben wird, unterscheiden sich die einzelnen Da-
tensätze voneinander. Dies sind meist die Namensfelder, also Datenfelder, die in
Textform die Bezeichner der Objekte enthalten. Dubletten, die in den Namensfel-
dern identische Werte haben, sind leicht zu erkennen und werden in vielen Fällen
durch Standardtechniken verhindert. Etwa durch ein UNIQUE-Constraint auf
einer Datenbanktabelle.
Sobald aber keine Identität in den Namensfeldern vorliegt, greifen diese Techniken
nicht mehr. So kommt es, dass durch Tippfehler oder Hörfehler , z.B. bei der Ein-
gabe im Callcenter, Kunden mehrfach angelegt werden, durch Hinzufügen, Weg-
lassen oder Abkürzen zusätzlicher Bestandteile Adressen unterschiedlich erfasst
werden („ Frankfurt am Main “, „ Frankfurt “, „ Frankfurt a. M. “), oder durch Vertau-
schen der Reihenfolge Bauteile mehrmals angelegt werden („ Hartmetall-Anbohrer “,
Anbohrer, Hartmetall “). Neben mangelnder Sorgfalt der Mitarbeiter spielt bei per-
sonenbezogenen Daten auch die bewusste Variierung der Angaben durch Kunden
oder Interessenten eine zunehmende Rolle, sei es wegen eines Betrugsversuchs
oder zum Schutz der Privatsphäre bei Webformularen mit zu vielen Pflichtfeldern.
Auch Fehler in Unternehmensprozessen können die Ursache für Dubletten sein:
Wenn beispielsweise beim Fahrzeugwechsel die Daten über die Versicherung des
Altfahrzeugs nicht korrekt gelöscht werden. Oder wenn ein Interessent nach Ver-
tragsabschluss sowohl als Neukunde, als auch weiterhin als Interessent geführt
wird.
5.2.3 Erkennen von Dubletten
Da Dubletten sich in den Werten, die das Objekt eindeutig beschreiben nur ähnlich
sind, kommt es bei der Entdeckung von Dubletten darauf an, ähnliche Werte zu
Search WWH ::




Custom Search