Database Reference
In-Depth Information
eine Ahnlichkeitsuntersuchung in Betracht kommen (z.B. mittels invertierter Indi-
zierung oder mit Hilfe hierarchischer Strukturen). Jeder als relevant erkannte Fall
der Fallbasis wird mit dem neuen Fall verglichen.
Es gibt eine Reihe von Ahnlichkeitsmaßen , die zu diesem Zweck angewendet
werden konnen. Sie berechnen einen numerischen Wert, der die Ahnlichkeit zwischen
beiden Fallen ausdruckt. Der oder die ahnlichsten Falle, also diejenigen mit dem
hochsten Ahnlichkeitswert , werden schließlich selektiert und entweder dem Benutzer
prasentiert oder zwecks Losungsadaption weitergeleitet. Wir werden im Folgenden
einige dieser Ahnlichkeitsmaße vorstellen. Zu diesem Zweck benutzen wir eine for-
male Reprasentation der Falle, bestehend aus Attribut-Wert-Paaren. Legen wir eine
Reihenfolge der Deskriptoren fest, so entspricht also jedem Fall x ein Tupel
x =(x 1 ,...,x n )
wobei jedes x i aus dem Wertebereich des i-ten Merkmals stammt. Hierbei wird
manchmal angenommen, dass alle x i reelle Zahlen sind, was man durch geeignete
Codierung stets erreichen kann.
Die Grundidee der meisten im fallbasierten Schließen verwendeten Ahnlich-
keitsmaße besteht darin, dass sich die (Gesamt-) Ahnlichkeit zweier Falle durch einen
Abgleich der einzelnen Merkmale bestimmen lasst:
sim ( x , y )= function ( sim 1 (x 1 ,y 1 ),..., sim n (x n ,y n ))
(6.1)
wobei x =(x 1 ,...,x n ), y =(y 1 ,...,y n )zweiFalle reprasentieren und die sim i
reelle Funktionen sind, die jeweils die Ahnlichkeit zwischen verschiedenen Werten
eines Merkmals bestimmen. Durch die Wahl verschiedener solcher Ahnlichkeitsfunk-
tionen ist es moglich, die spezifischen Eigenheiten der Merkmale zu berucksichtigen.
Allerdings sollte darauf geachtet werden, dass die resultierenden einzelnen Ahnlich-
keiten auf einer fur alle Deskriptoren verbindlichen Skala gemessen und interpretiert
werden, d.h. ein Ahnlichkeitswert von z.B. 0.9 auf einer Skala von 0 bis 1 sollte fur
alle Merkmale bedeuten “ sehr ahnlich ”.
Die Hamming- Ahnlichkeit
6.8.1
Wir beginnen mit einem recht einfachen und groben Ahnlichkeitsmaß, das fur
zweiwertige Merkmale aber eine sehr fundamentale Bedeutung hat und auf der
Hamming-Distanz basiert.
Wir nehmen zunachst an, dass alle unsere Attribute zweiwertig sind, also durch
Werte wie wahr, falsch; ja, nein; Frau, Mann etc. beschrieben werden konnen. Wir
vereinbaren x i ,y i ∈{0, 1} mit einer entsprechenden Interpretation der Werte. Die
Hamming-Distanz zweier Falle x , y ist dann definiert durch
n
dist H ( x , y )=
|
x i
y i |
i=1
Stimmen x und y in allen Komponenten uberein, so ist der Hamming-Abstand
zwischen ihnen 0, sind sie vollkommen verschieden (d.h. x i
= y i fur alle i), so
betragt der Hamming-Abstand zwischen ihnen n, ist also maximal. Um daraus ein
Ahnlichkeitsmaß zu gewinnen, das Werte zwischen 0 und 1 annimmt, bilden wir
Search WWH ::




Custom Search