Database Reference
In-Depth Information
Im obigen Fall ist die durch PIN induzierte Verteilung eine Gleichverteilung
(k = n und P ( PIN = w i )= n ), also ist der Normierungsfaktor H( PIN )=log 2 n
und damit maximal (vgl. Proposition A.39, S. 503, im Anhang). Das System C4.5
wahlt als nachstes Attribut dasjenige mit dem maximalen gain ratio -Wert aus ( gain
ratio -Kriterium).
Selbsttestaufgabe 5.11 (gain ratio) Berechnen Sie im Kinobeispiel (Abbildung
5.3) gain ratio (a) auf der Basis der gesamten Beispielmenge fur die Attribute At-
traktivitat , Wetter und Gruppe und entscheiden Sie, welches dieser drei Attribute
sich nach dem gain ratio -Kriterium am besten als nachstes Attribut eignet.
Um die Auswahl noch weiter zu verbessern, konnen absoluter und normierter
Informationsgewinn kombiniert werden: Man maximiert dann gain ratio (a)unter
der Nebenbedingung, dass gain (a) uber einem gewissen Schwellenwert liegt (vgl.
[187]). Es werden aber auch andere statistische Verfahren eingesetzt (vgl. [161]).
Selbsttestaufgabe 5.12 (Auftragsmanagement) Die Informatikerin und Web-
Designerin Dorte Nett wird von Auftragen uberhauft und muss einige ablehnen. In
einer Tabelle protokolliert sie, welche Auftrage sie bekommen hat, aus welchem
Bereich sie kamen, wie hoch der Aufwand war, ob die Sache interessant war, was
sie fur ein Bauchgefuhl dabei hatte und ob sie den Auftrag letztlich angenommen
hat.
Kd. Nr.
Bereich
Aufwand
Attraktivitat
Bauchgefuhl
Klass.
1
Handwerker
groß
gering
gut
-
2
Handwerker
gering
gering
neutral
-
3
Handwerker
mittel
mittel
gut
+
4
Handwerker
mittel
mittel
schlecht
-
5
Beratungsnetz
mittel
hoch
neutral
+
6
Beratungsnetz
gering
mittel
neutral
-
7
Beratungsnetz
groß
mittel
schlecht
+
8
Beratungsnetz
mittel
gering
gut
+
9
Online-Shop
groß
hoch
schlecht
-
10
Online-Shop
mittel
mittel
schlecht
-
11
Online-Shop
mittel
gering
gut
+
12
Online-Shop
groß
hoch
gut
+
1. Bestimmen Sie einen Entscheidungsbaum zur Klassifizierung der Entscheidun-
gen. Wahlen Sie die Attribute nach dem gain ratio - Kriterium aus.
2. Bestimmen Sie die entsprechenden Entscheidungsregeln.
3. Benutzen Sie die Aussagenvariablen
bh
Bereich = Handwerker
ao
Aufwand = groß
bb
Bereich = Beratungsnetz
am
Aufwand = mittel
bo
Bereich = Online-Shop
ag
Aufwand = gering
atg
Attraktivitat = gering
gg
Gefuhl = gut
atm
Attraktivitat = mittel
gn
Gefuhl = neutral
ath
Attraktivitat = hoch
gs
Gefuhl = schlecht
Search WWH ::




Custom Search