Databases Reference
In-Depth Information
Die Qualität eines Attributwertes wird also hinsichtlich Vollständigkeit mit dem
Minimalwert von null bewertet, falls das entsprechende Attribut nicht befüllt ist
oder einen zu NULL (semantisch) äquivalenten (Default-)Wert enthält (z. B. Dum-
my-Wert). Ansonsten ergibt sich der Wert der Metrik auf Attributwertebene zu
eins.
Probleme bei der Metrik können dann auftreten, wenn ein Attributwert nicht aus
Mangel an verfügbaren Daten mit NULL belegt ist, sondern, weil der entsprechen-
de Wert in der Realwelt gar nicht existiert (z. B. Name des Ehepartners bei ledigen
Personen). In diesem Fall wäre das entsprechende Attribut mit dem Wert NULL in
der Tat richtig belegt und die Bewertung hinsichtlich Vollständigkeit müsste den
Wert eins und nicht den Wert null liefern. Schwierigkeiten dieser Art können um-
gangen werden, indem Indikatoren dafür eingeführt werden, dass der entspre-
chende Wert in der Realwelt nicht existiert. So kann beispielsweise das Attribut
Name des Ehepartners (automatisiert) mit „ nicht verheiratet “ belegt werden, falls bei
der Erfassung des Familienstandes ledig angegeben wird. Somit ist das entspre-
chende Attribut in der Datenbank befüllt und die obige Metrik liefert auf Attri-
butwertebene den korrekten Wert eins. Vor der ersten Anwendung der Metrik
müssen die Daten somit hinsichtlich der vorgestellten Problematik untersucht und
ggf. auftretende Schwachstellen beseitigt werden. Hierbei wäre beispielsweise an
eine Vervollständigung des Datenbestands mit Indikatoren zu denken, sofern dies
technisch sowie fachlich möglich und sinnvoll ist und keine Seiteneffekte auf Er-
gebnisse anderer Metriken besitzt.
Im Folgenden wird, basierend auf den obigen Ausführungen zur Attributwertebe-
ne, die Metrik auf Tupelebene formuliert. Sei hierbei T ein Tupel mit den Attribut-
werten T.A 1 , T.A 2 , …, T.A |A| für die Attribute A 1 , A 2 , …, A | A| und g i [0; 1] die rela-
tive Wichtigkeit von A i in Bezug auf Vollständigkeit. Dann ergibt sich unter Ver-
wendung der Metrik auf Attributwertebene die Metrik auf Tupelebene als gewich-
tetes arithmetisches Mittel:
A
¦
Q
T
.
A
g
Vollst
.
i
i
:
i
1
Q
T
Vollst
.
A
¦
g
i
i
1
Die Vollständigkeit eines Tupels wird folglich basierend auf der Vollständigkeit
der enthaltenen Attributwerte berechnet. Dabei ist es möglich, diese je nach Ziel-
setzung mit Gewichtungen g i zu versehen. Dies ist insofern sinnvoll, da je nach
zugrunde liegendem Zweck in einem Anwendungskontext die Attribute von un-
terschiedlicher Bedeutung sind. So sind z. B. für die Durchführung von Mailing-
kampagnen Attribute wie Name , Vorname , Adresse oder E-Mail besonders relevant,
Search WWH ::




Custom Search