Database Reference
In-Depth Information
Zwei Attributwerte x
i
,y
i
werden dabei als
hinreichend ahnlich
angesehen, wenn
fur den zugehorigen Ahnlichkeitswert 1
≥
sim
i
(x
i
,y
i
) > 1
−
δ
i
gilt, wobei δ
i
> 0ist.
δ
i
stellt also einen
Schwellenwert
fur die Ahnlichkeit dar, der fur jedes Merkmal
festgelegt werden kann.
Die Falle der Fallbasis von PATDEX sind Tupel
x
=(x
1
,...,x
n
; D
j
), wo-
bei jedes x
i
das entsprechende Attribut bzw. Symptom A
i
beschreibt und D
j
∈
{
1
−
die (bestatigte) Diagnose des Falles
x
ist. Bei der Diagnose handelt
es sich also im Wesentlichen um eine Klassifikationsaufgabe, bei der die Diagno-
sen D
1
,...,D
m
die moglichen und verschiedenen Klassen darstellen. Da Symptome
oft mehr oder weniger typisch fur eine bestimmte Diagnose sind, wird fur jedes
Attribut-Diagnose-Paar (A
i
,D
j
)einGewichtsfaktorw
ij
= w
i
(D
j
) bestimmt, der
die Relevanz des Symptoms A
i
fur die Diagnose D
j
ausdruckt. Alle diese Relevanz-
faktoren werden in der
Relevanzmatrix
D
1
,...,D
m
}
⎛
⎞
D
1
D
2
···
D
m
⎝
⎠
A
1
w
11
w
12
···
w
1m
A
2
w
21
w
22
···
w
2m
R =
.
.
.
.
.
.
.
A
n
w
n1
w
n2
···
w
nm
zusammengefasst. Hierbei wird
n
w
ij
=1
i=1
fur alle j
aus Normierungsgrunden gefordert.
Um auch unvollstandige Fallbeschreibungen bearbeiten zu konnen, wird fur
jedes Attribut A
i
der Wertebereich um den Wert
unbekannt
(i)
erweitert, und wir
setzen
sim
i
(
x
i
,
y
i
)=0,wennx
i
=
unbekannt
(i)
oder y
i
=
unbekannt
(i)
ist.
Der Kontext zur Berechnung der Ahnlichkeit zwischen einem neuen Fall
y
und
einem Fall
x
der Fallbasis wird hier durch den bereits behandelten Fall bzw. durch
die zugehorige Diagnose bestimmt. Sei also
∈{
1,...,m
}
x
= x
1
,...,x
n
; D
j
)
y
= y
1
,...,y
n
; ???)
Zu diesen beiden Fallen definieren wir die folgenden Indexmengen:
=
unbekannt
(i)
,
sim
i
(x
i
,y
i
) > 1
•E
:=
{
i
|
x
i
,y
i
−
δ
i
}
(hinreichend ahnliche
(
Equal
) Attributwerte);
=
unbekannt
(i)
,
sim
i
(x
i
,y
i
)
•C
:=
{
i
|
x
i
,y
i
≤
1
−
δ
i
}
(signifikant unterschiedli-
che (
Conflicting
) Attributwerte);
y
i
=
unbekannt
(i)
•U
:=
{
i
|
}
(unbekannte (
Unknown
) Attributwerte des neuen
Falls);
x
i
=
unbekannt
(i)
•A
:=
{
i
|
∧
y
i
ist abnormal
}
(abnormale (
Abnormal
) Attri-
butwerte des neuen Falls).