Database Reference
In-Depth Information
Die Ahnlichkeit zwischen y und x 1
lasst sich dann beispielsweise wie folgt bestim-
men:
10
1
10
sim H ( y , x 1 )=1
|
x 1i
y i |
i=1
1
10 ·
=1
5
=0.5
Selbsttestaufgabe 6.12 ( Ahnlichkeit) Berechnen Sie alle Ahnlichkeitswerte im
obigen Beispiel zwischen y und den Fallen x 1 ,..., x 15 .WelcheFalle der Fallbasis
{
x 1 ,..., x 15 }
sind dem neuen Fall y am ahnlichsten?
Die gewichtete Hamming- Ahnlichkeit
6.8.2
Beim Lernen von Entscheidungsbaumen hatten wir allerdings bereits das Problem
angesprochen, dass einige Attribute fur die Entscheidung bzw. fur die Beurteilung
einer Situation (wie es beim fallbasierten Schließen erforderlich ist) wichtiger sein
konnen als andere. Eine solche Priorisierung lasst sich bei der Ahnlichkeitsbemes-
sung durch unterschiedliche Gewichte , die man den Attributen zuordnet, realisieren.
Die Formel (6.2) fur die Hamming- Ahnlichkeit lasst sich auch in der Form
i=1 |
sim H ( x , y )= n
x i
y i |
n
i=1 (1
−|
x i
y i |
)
=
n
messen jeweils die Ahnlichkeiten der Attri-
butwerte, wobei jede Ahnlichkeit mit demselben Gewicht, namlich 1, in die Berech-
nung eingeht. Das lasst sich durch die Einfuhrung nichtnegativer Gewichtsfaktoren
w i verallgemeinern, und man erhalt eine gewichtete Hamming- Ahnlichkeit mit Hilfe
der Formel
schreiben. Die Summanden 1
−|
x i
y i |
sim H ( x , y )= i=1 w i (1
−|
x i
y i |
)
i=1 w i
(w i
0)
(6.3)
1
P i=1 w i
wiederum fur binare Attribute. Der Faktor
dient der Normierung, so dass
sim H ( x , y )
wie bisher 0
1 gilt. Der Gewichtsfaktor w i druckt aus, wie stark der
Ahnlichkeitswert des i-ten Merkmalswerts die Gesamtahnlichkeit beeinflussen soll.
Er beruht nicht selten auf subjektiven Einschatzungen, also auf Expertenwissen.
Fur Berechnungen ist es oft gunstiger, Formel (6.3) in eine (6.2) ahnliche Form
zu bringen:
Search WWH ::




Custom Search