Database Reference
In-Depth Information
+: X2,X5,X11,X15
: X10
Kategorie?
DR
AC
KO
SF
+: X5,X11
+: X15
+: X2
+:
:
:
: X10
:
Abbildung 5.5 Aufteilung der Beispielmenge {X 2 ,X 5 ,X 10 ,X 11 ,X 15 } des Kinoproblems
durch das Attribut Kategorie
Selbsttestaufgabe 5.4 macht deutlich, dass die Wichtigkeit eines Attributs ein
relativer Begriff ist und sehr stark von der aktuellen Beispielmenge, die noch zu
klassifizieren ist, abhangt. So ist das Attribut Kategorie als erste Abfrage fur die
gesamte Beispielmenge
ziemlich nutzlos, wie dies in Abbildung 5.4(b)
illustriert ist. Andererseits hat gerade dieses Attribut fur die ubrig gebliebene Bei-
spielmenge
{
X 1 ,...,X 15 }
unter allen ubrig gebliebenen Attributen
gemaß Selbsttestaufgabe 5.4 die großte Wichtigkeit.
Nachdem das erste Attribut als Markierung des Wurzelknotens des zu generie-
renden Entscheidungsbaumes ausgewahlt worden ist, erhalten wir fur jede der durch
die verschiedenen Attributwerte bestimmten Teilmengen der Trainingsmenge wie-
der eine Instanz des Lernproblems fur Entscheidungsbaume. Dabei gibt es jeweils
weniger Trainingsbeispiele und eine um ein Attribut verringerte Attributmenge. Es
sind vier Falle fur diese rekursiven Lernprobleminstanzen zu unterscheiden.
{
X 1 ,X 3 ,X 6 ,X 7 ,X 8 ,X 9 ,X 14 }
1. Falls die Menge der Beispiele leer ist, bedeutet dies, dass kein Beispiel mit
der entsprechenden Attribut-Werte-Kombination in der ursprunglichen Trai-
ningsmenge vorhanden war. In diesem Fall konnte man eine Defaultklassifi-
kation angeben; im Folgenden nehmen wir an, dass als Defaultwert diejenige
Klassifikation - bezeichnet durch MajorityVal(E) - genommen wird, die auf
die Mehrzahl der Beispiele E an dem Elternknoten gegeben ist. Dieser Fall
tritt in Abbildung 5.5 bei dem Attributwert Kategorie = SF auf. Da die
Beispielmenge E =
an den Elternknoten vier positi-
ve Beispiele und nur ein negatives Beispiel enthalt, ist MajorityVal(E) = ja ,
und dies wurde als Defaultklassifikation fur den Attributwert Kategorie = SF
an dieser Stelle ausgegeben.
(Fur den Fall, dass E genauso viele positive wie negative Beispiele enthalt,
konnte man vereinbaren, dass MajorityVal(E) eine positive Klassifikation lie-
fert.)
{
X 2 ,X 5 ,X 10 ,X 11 ,X 15 }
2. Falls alle Beispiele die gleiche Klassifikation aus
haben, wird diese
Klassifikation ausgegeben. In Abbildung 5.4(c) wird dies durch den Fall fur
allein illustriert.
{
ja , nein
}
Search WWH ::




Custom Search