Database Reference
In-Depth Information
F-Measure
Aus Precision und Recall lässt sich das F-Measure ableiten, welches das harmo-
nische Mittel aus Precision und Recall darstellt und in Abbildung 5.8 dargestellt
ist. Hierbei fällt auf, dass der Wert der Sorted-Neighborhood-Methode nur ge-
ringfügig unter dem des vollständigen Vergleichs liegt. Durch Vergrößerung der
Fenstergröße gleichen sich beide Verfahren weiter an, bis der F-Measure sogar
geringfügig über dem des vollständigen Vergleichs liegt.
Beim Blocking ist der Effekt der Annäherung an den vollständigen Vergleich
ebenfalls zu beobachten. Hier sind jedoch weitaus mehr Tupelvergleiche für die
Annäherung notwendig als bei der Sorted-Neighborhood-Methode. Insbesonde-
re bei kleinen Partitionsgrößen liegt der Wert des Blockings deutlich unter dem
der Sorted-Neighborhood-Methode und des vollständigen Vergleichs. Dies liegt
an dem zunächst sehr geringen Recall des Blockings.
1
0.9
0.8
0.7
0.6
0.5
Vollständiger Vergleich mit transitiver Hülle
Vollständiger Vergleich ohne transitive Hülle
Blocking
Sorted Neighborhood
0.4
0
20000
40000
60000
80000 100000 120000 140000 160000 180000 200000
Anzahl Vergleiche
Abbildung 5.8: Vergleich des F-Measure
 
Search WWH ::




Custom Search