Database Reference
In-Depth Information
nicht hinreichend erfüllt. Dies macht noch einmal die Abhängigkeit der Ergeb-
nisse beim Blocking vom Blocking-Schlüssel deutlich.
Der Hauptspeicherbedarf wurde im Rahmen des praktischen Vergleichs nicht
untersucht. Aufgrund der geringen Anzahl von Testdatensätzen und den kleinen
Partitionsgrößen sind keine validen Ergebnisse zu erwarten gewesen, da die Tupel
pro Partition im Hauptspeicher gehalten werden können und somit keine Ausla-
gerung auf die Festplatte erforderlich ist. Im Hinblick auf die Entwicklung eines
verallgemeinerten Verfahrens ist der Hauptspeicherbedarf jedoch auch ein zu be-
rücksichtigendes Kriterium.
Insgesamt sind die Ergebnisse der Sorted-Neighborhood-Methode besser, als
die Ergebnisse des Blockings, was insbesondere auf die bessere Abdeckung an
den Partitionsgrenzen zurückzuführen ist. Im Hinblick auf die Precision erzielen
beide Verfahren sogar bessere Ergebnisse als der vollständige Vergleich. Durch
die Partitionierung wird erreicht, dass nur ähnliche Tupel miteinander verglichen
werden und somit Unschärfen der Vergleichsfunktion nicht so stark ins Gewicht
fallen.
Search WWH ::




Custom Search