Information Technology Reference
In-Depth Information
Definition 23.10 (Projektion (eines Tupels))
Sei
t
X
ein Tupel über einer Menge X von
Zufallsvariablen und Y
X. Dann steht
proj
Y
(
t
X
)
für die
Projektion
des Tupels t
X
auf Y.
D. h., die Abbildung
proj
Y
(
t
X
)
weist nur Elementen aus Y einen Wert zu.
Ist die Menge
X
klar vom Kontext, werden wir diese wie
V
weiter oben weglassen.
Bisher haben wir immer sämtliche Zufallsvariablen zur Berechnung von Wahr-
scheinlichkeiten in Betracht gezogen. Sind Wahrscheinlichkeiten über weniger Zu-
fallsvariablen von Interesse, marginalisiert (summiert) man über sämtliche Wertkom-
binationen aller zu eliminierenden Zufallsvariablen.
Definition 23.11 (Marginalisierung, Randverteilung, Marginalverteilung)
Sei V
= {
X
1
,...,
X
n
}
eine Menge von Zufallsvariablen auf demselben Wahrscheinlichkeits-
raum und p
V
eine Wahrscheinlichkeitsverteilung über V. Für jede Teilmenge M
Vistdie
Marginalisierung über
MdefiniertalsdiejenigeVerteilungp
V
\
M
,dieentsteht,wennüber
alle Werte aller Zufallsvariablen in M summiert wird, d. h. wenn gilt:
x
1
dom
(
X
1
)
:
···
x
n
dom
(
X
n
)
:
X
j
M
:
X
i
=
x
i
=
X
j
=
x
j
,
X
i
=
x
i
p
V
\
M
p
V
.
X
j
M
X
i
V
\
M
X
i
V
\
M
dom
(
X
j
)
x
j
Für V
\
M
= {
X
}
nennt man p
X
die
Marginal-
oder
Randverteilung
von X.
So berechnet man aus Tabelle 23.1 z. B. die folgenden marginalenWahrscheinlich-
keiten:
P
(G = m)=0.5
P
(R = r)=0.3
P
(G = w)=0.5
P
(R = r)=0.7
P
(R = r, S = s)=0.01
P
(R = r, S = s)=0.29
P
(R = r, S = s)=0.04
P
(R = r, S = s)=0.66
In den letzten Absätzen wurden die Begriffe Zufallsvariable und Attribut gleich-
bedeutend genutzt. Einige andere synonyme Begriffe, die im weiteren Verlauf An-
wendung finden, sind
Zufallsgröße
,
Eigenschaft
und
Dimension
.Darüberhinauswer-
den wir bei Wahrscheinlichkeitsangaben nur noch mit Zufallsvariablen arbeiten;
nicht mehr mit direkt gegebenen Ereignissen als Teilmengen von .Esseidaher
noch einmal der formale Unterschied der Wahrscheinlichkeitsangaben betont: Bei
einem Ereignis
A
,alsoeinerTeilmenge
A
,steht
P
(
A
)
für eine konkrete Wahr-
scheinlichkeit, d. h.
P
(
A
) [
0, 1
]
.Handeltessichbei
A
jedoch (wie ab jetzt immer)
um eine Zufallsvariable, so stellt der Ausdruck
P
(
A
)
eine allquantifizierte Aussage
über alle Elemente des Wertebereiches von
A
dar. Für zwei Zufallsvariablen
A
und
B
steht
P
(
A
|
B
)=
P
(
A
,
B
)
P
(
B
)
für die folgende ausführliche Aussage:
a
dom(
A
) :
b
dom(
B
) :
P
(
A
=
a
|
B
=
b
)=
P
(
A
=
a
,
B
=
b
)
P
(
B
=
b
)