Information Technology Reference
In-Depth Information
Alle Zahlen in
Promille
220 330 170 280
g 1
g 2
g 3
g 4
m 3
20 90 10 80
2120 17
28 24 53
18 81 9 72
8408
56
400
240
360
m 2
m 1
b 3
300
b 1
b 2
b 3
48
10
6
m 3
20
180 200
b 2
m 3
2
9
1
8
m 2
460
40
160
40
m 2
2120
17
m 1
180 120
60
m 1
84
72
15
9
g 1
g 2
g 3
g 4
b 1
g 1
g 2
g 3
g 4
240
m 3
b 3
40 180 20 160
12 6 0 2
168 144
50
115
35
100
m 2
b 2
82
133
99
146
m 1
b 1
30
18
88
82
36
34
Abbildung 22.1: Dreidimensionale Wahrscheinlichkeitsverteilung über den Attribu-
ten Getriebe, Motor und Bremse.ZusätzlichsinddieMarginalverteilungen(Summen
über Zeilen, Spalten oder beides) angegeben.
und besitzt damit mehr unterschiedliche Ausprägungen als das sichtbare Univer-
sum Elementarteilchen. 3 Eine Summation selbst über Teilbereiche der Verteilung ist
dann nicht mehr möglich. Ebenfalls muss die Verteilung effizient abgespeichert wer-
den, da es zum einen unmöglich ist, alle Attributwert-Kombinationen abzuspeichern
und diese zum anderen wahrscheinlich nie benötigt werden. Letzteres überlegt man
sich leicht wie folgt: Selbst wenn alle Fahrzeuge auf der Erde von unserem fiktiven
Hersteller geliefert würden und keine zwei Fahrzeuge sich glichen, dann ist diese
Anzahl (im dreistelligen Millionenbereich liegend geschätzt) verschwindend gering
im Vergleich zu den theoretisch möglichen 3 200 .
Die grundlegende Idee, eine hochdimensionale Verteilung p ,diedasWissenüber
einen Anwendungsbereich enthält, effizient zu speichern und zu verwenden besteht
darin, sie in eine Menge { p 1 ,..., p s } von (möglicherweise überlappenden) Vertei-
lungen geringerer Dimension zu zerlegen. Wenn dies möglich ist, können aus die-
sen Verteilungen die gleichen Schlüsse gezogen werden, wie aus der Originalver-
teilung p .Wiemanleichtnachprüft,giltinderBeispielverteilung P ( G , M , B ) aus
Abbildung 22.1 folgender Zusammenhang:
P ( G = g , M = m , B = b )= P ( G = g , M = m ) · P ( M = m , B = b )
P ( M = m )
(22.1)
Offenbar reichen die beiden zweidimensionalen Verteilungen über die Attribute B
und M ,sowie G und M aus 4 ,umdiedreidimensionaleOriginalverteilungfehler-
frei wiederherzustellen. Das Attribut M spielt offensichtlich eine besondere Rolle
3 Bei einer Schätzung von 10 87 Elementarteilchen im Universum.
4 Die eindimensionale Verteilung über M lässt sich durch vertretbar aufwändiges Summieren über eine
der beiden zweidimensionalen Verteilungen generieren.
Search WWH ::




Custom Search