Information Technology Reference
In-Depth Information
Abbildung 26.2: Allgemeine
Potentialtabelle des Attributes A i .Jede
Spalte stellt eine
Wahr s che i n l i chke i t sve r t e i l ung da r.
Abbildung 26.1: Induktion der
Potentialtabellenstruktur B S des
dargestellten Bayes-Netzes.
für jede einzelne Attributwertkombination der Elternattribute eines Knotens A i die
Wahr s che i n l i chke i t sve r t e i l ung de r At t r i butwe r t e von A i beinhaltet. Allgemein ha-
be die Potentialtabelle des Attributes A i die Spalten Q i 1 ,..., Q iq i .Jededieser q i
Spalten entspricht einer bedingten Wahrscheinlichkeitsverteilung der Attributwer-
te a i 1 ,..., a ir i gegeben die mit der Spalte assoziierte Attributwertkombination der
Attribute in pa ( A i ) .
Als Veranschaulichung diene ein einfaches Bayes-Netz, wie es in Abbildung 26.1
zu sehen ist. Die Attribute seien alle zweiwertig und bedeuten Grippe, Malaria und
Fieber.SohatderKnotenF zwei Elternattribute (G und M), die jeweils zweiwertig
sind. Daher gibt es vier verschiedene Kombinationen der Elternattributwerte: ( g, m ) ,
( g, m ) , ( g, m ) und ( g, m ) ,diedenvierSpaltenderPotentialtabellefürF in Abbil-
dung 26.1 entsprechen. Handelt es sich bei dem Knoten A i um einen Wurzelknoten,
so besteht die Potentialtabelle aus der Marginalverteilung P ( A i ) .Diesekünstliche
Spalte wird in der Abbildung mit bezeichnet.
Die Einträge dieser Tabellen werden mit ijk notiert und stehen für die Wahr-
scheinlichkeit, dass das Attribut A i den Wert a ik annimmt, während gleichzeitig die
Elternattribute pa ( A i ) die j -te Ausprägung Q ij annehmen. Abbildung 26.2 zeigt ei-
ne allgemeine Potentialtabelle, deren Indizes im Folgenden weiterverwendet wer-
den, d. h. der Index i läuft über die Attribute ( i = 1, . . . , n ), j läuft über die ver-
schiedenen Elternattributwertkombinationen des Attributes A i ( j = 1, . . . , q i )und
k bezeichne nacheinander alle r i Attributausprägungen von A i ( k = 1, . . . , r i ). Die
We r t e ( ij 1 ,..., ijr i ) stellen wie erwähnt eine Wahrscheinlichkeitsverteilung dar. Sie
entsprechen den Parametern einer Multinomialverteilung r i -ter Ordnung.
Es sollen nun zwei Beispiele für das Berechnen der Parameter B P aus den Da-
ten D und einer gegebenen Struktur B S gegeben werden. Hat man eine Datenbasis D
mit Fallbeispielen und eine Netzstruktur B S gegeben, so kann man die Parameter B P
leicht durch Auszählen der Daten bestimmen. Dies ist gerechtfertigt, da die beding-
ten Verteilungen Multinomialverteilungen sind und die relativen Attributwerthäu-
figkeiten optimale Schätzwerte liefern. Tabelle 26.1 zeigt eine Beispieldatenbasis mit
einhundert Datensätzen.
Search WWH ::




Custom Search