Database Reference
In-Depth Information
Das F-Measure, welches als harmonisches Mittel aus Precision und Recall defi-
niert ist, ist in Abbildung 6.7 graphisch dargestellt. Hier sind die gleichen Auffäl-
ligkeiten im Kurvenverlauf des verallgemeinerten Verfahrens zu beobachten, wie
schon bei Precision und Recall. Zunächst entspricht das F-Measure bei gleicher
Anzahl an Tupelvergleichen dem der Sorted-Neighborhood-Methode. Bei einer
Partitionsgröße m
6 ist ein Anstieg wie beim Recall zu beobachten. Im weite-
ren Verlauf des Graphen kommt es bei m
=
11 jedoch wieder zu einem Schnitt-
punkt mit der Sorted-Neighborhood-Methode. Das F-Measure liegt zweitweise so-
gar über demWert des vollständigen Vergleichs. Mit zunehmender Partitionsgröße
kommt es zu ähnlichen Ausschlägen wie beim Blocking. Das F-Measure des ver-
allgemeinerten Verfahrens bleibt jedoch stets über dem des Blockings.
=
0.9
0.88
m=6
m=11
0.86
w=4
0.84
0.82
0.8
0.78
Vollständiger Vergleich mit transitiver Hülle
Vollständiger Vergleich ohne transitive Hülle
Blocking
Sorted Neighborhood
Neues Verfahren, u=2
0.76
0
20000
40000
60000
80000
100000
120000
Anzahl Vergleiche
Abbildung 6.7: Vergleich des F-Measure
 
Search WWH ::




Custom Search