Database Reference
In-Depth Information
Sortierte Tupel
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11
X
12
X
13
X
14
X
15
X
16
X
17
X
18
X
19
X
20
X
Sorted Neighborhood Methode
Blocking-Verfahren
Abbildung 5.2: Vergleich Blocking- und Sorted-Neighborhood-Methode
bene Beispiel gilt
12. Betrachtet man die nur durch
die Sorted-Neighborhood-Methode zusätzlich durchgeführten Tupelvergleiche, so
wird deutlich, dass diese an den Kanten der Blöcke liegen. Der Bereich des Über-
gangs zwischen zwei Blöcken wird also durch die Sorted-Neighborhood-Methode
besser abgedeckt. Hierdurch wird offensichtlich, dass der Blockingschlüssel eine
korrekte Abgrenzung zwischen den Blöcken erreichen muss, um nicht Duplikate
zu übersehen.
|
F
\
B
| =
9 und
|
B
\
F
| =
Das Blocking-Verfahren demgegenüber erreicht eine bessere Abdeckung bei
Elementen am Rand der Blöcke. Beim Blocking sind die Partitionen (Blöcke)
größer als die Partitionen (Fenster) der Sorted-Neighborhood-Methode. So wer-
den auch weiter auseinander liegende Elemente miteinander verglichen. Dies gilt
allerdings nur für eine Richtung der Sortierreihenfolge. Während bei der Sorted-
Search WWH ::




Custom Search