Information Technology Reference
In-Depth Information
eines Attributes erfolgt die Gruppierung nach den verschiedenen Elternattribut-
wertkombinationen (im Beispiel für F sind dies ( g, m ) , ( g, m ) , ( g, m ) und ( g, m ) ).
Schließlich erfolgt die Sortierung nach gleichen Attributausprägungen (im Beispiel
für Attribut F:erstf,dannf).
Die allgemeine Darstellung der Wahrscheinlichkeit einer Datenbasis D lautet:
q i
j = 1
r i
k =1 ijk
n
i = 1
P ( D | B S , B P )=
(26.1)
ijk
Wir haben gesehen, dass bei bekannter Struktur B S die Parameter B P aus den
vollständigen Daten geschätzt werden können. Dies würde auf den ersten Blick für
die Anwendung eines Maximum Likelihood-Verfahrens sprechen:
B S = argmax
B S B R
P ( D | B S , B P )
Dieses Verfahren hat allerdings den Nachteil, dass die Wahrscheinlichkeit mit der
Anzahl der Parameter ansteigt. Ein solches Verfahren wird daher immer ein Modell
mit maximaler Parameteranzahl ergeben und damit einen vollständig verbundenen
Graphen als Struktur B S .
Dem Problem kann durch eine Maximum A-posteriori-Schätzung beigekommen
werden. Der Ansatz lautet demnach:
P ( D | B S ) P ( B S )
P ( D )
B S =
P ( B S | D )=argmax
B S
argmax
B S
P ( D , B S ) P ( B S )
P ( D ) P ( B S )
P ( B S , D )
P ( D )
=
= argmax
B S
=
argmax
B S
P ( B S , D )
Folglich suchen wir eine Berechnungsvorschrift für den Ausdruck P ( B S , D ).Das
Ergebnis der folgenden Herleitung wird die K2-Metrik sein. 3
Zuerst betrachtet man P ( B S , D ) als Marginalisierung von P ( B S , B P , D ) über al-
le möglichen Parameter B P .DiesesVerfahrenistals Model Averaging bekannt. Die
Anzahl dieser Parameter ist zwar endlich (endliche Anzahl von Einträgen in den Po-
tentialtabellen der Attribute), jedoch sind die Zahlenwerte der Einträge — die ijk
reelle Größen, weswegen wir auf das Integral über alle Modelle übergehen müssen.
Ta t sä chl i ch hande l t e s s i ch um e i n Mehr f a chi nt egr a l übe r a l l e ijk ,welchesspäter
konkret ausformuliert wird.
3
Eine ausführliche Betrachtung findet sich in [Cooper u. Herskovits 1992].
Search WWH ::




Custom Search