Database Reference
In-Depth Information
+:
X2,X5,X11,X15
−
:
X10
Kategorie?
DR
AC
KO
SF
+:
X5,X11
−
+:
X15
−
+:
X2
−
+:
−
:
:
:
X10
:
Abbildung 5.5
Aufteilung der Beispielmenge
{X
2
,X
5
,X
10
,X
11
,X
15
}
des Kinoproblems
durch das Attribut
Kategorie
Selbsttestaufgabe 5.4 macht deutlich, dass die
Wichtigkeit eines Attributs
ein
relativer Begriff ist und sehr stark von der aktuellen Beispielmenge, die noch zu
klassifizieren ist, abhangt. So ist das Attribut
Kategorie
als erste Abfrage fur die
gesamte Beispielmenge
ziemlich nutzlos, wie dies in Abbildung 5.4(b)
illustriert ist. Andererseits hat gerade dieses Attribut fur die ubrig gebliebene Bei-
spielmenge
{
X
1
,...,X
15
}
unter allen ubrig gebliebenen Attributen
gemaß Selbsttestaufgabe 5.4 die großte Wichtigkeit.
Nachdem das erste Attribut als Markierung des Wurzelknotens des zu generie-
renden Entscheidungsbaumes ausgewahlt worden ist, erhalten wir fur jede der durch
die verschiedenen Attributwerte bestimmten Teilmengen der Trainingsmenge wie-
der eine Instanz des Lernproblems fur Entscheidungsbaume. Dabei gibt es jeweils
weniger Trainingsbeispiele und eine um ein Attribut verringerte Attributmenge. Es
sind vier Falle fur diese rekursiven Lernprobleminstanzen zu unterscheiden.
{
X
1
,X
3
,X
6
,X
7
,X
8
,X
9
,X
14
}
1. Falls die Menge der Beispiele leer ist, bedeutet dies, dass kein Beispiel mit
der entsprechenden Attribut-Werte-Kombination in der ursprunglichen Trai-
ningsmenge vorhanden war. In diesem Fall konnte man eine Defaultklassifi-
kation angeben; im Folgenden nehmen wir an, dass als Defaultwert diejenige
Klassifikation - bezeichnet durch
MajorityVal(E)
- genommen wird, die auf
die Mehrzahl der Beispiele E an dem Elternknoten gegeben ist. Dieser Fall
tritt in Abbildung 5.5 bei dem Attributwert
Kategorie
=
SF
auf. Da die
Beispielmenge E =
an den Elternknoten vier positi-
ve Beispiele und nur ein negatives Beispiel enthalt, ist
MajorityVal(E)
=
ja
,
und dies wurde als Defaultklassifikation fur den Attributwert
Kategorie
=
SF
an dieser Stelle ausgegeben.
(Fur den Fall, dass E genauso viele positive wie negative Beispiele enthalt,
konnte man vereinbaren, dass
MajorityVal(E)
eine positive Klassifikation lie-
fert.)
{
X
2
,X
5
,X
10
,X
11
,X
15
}
2. Falls alle Beispiele die gleiche Klassifikation aus
haben, wird diese
Klassifikation ausgegeben. In Abbildung 5.4(c) wird dies durch den Fall fur
allein
illustriert.
{
ja
,
nein
}