Maschinelles Lernen - Methoden Wissensbasierter Systeme

Database Reference

In-Depth Information

+: X2,X5,X11,X15

−

: X10

Kategorie?

DR

AC

KO

SF

+: X5,X11

−

+: X15

−

+: X2

−

+:

−

:

: X10

:

Abbildung 5.5 Aufteilung der Beispielmenge {X 2 ,X 5 ,X 10 ,X 11 ,X 15 } des Kinoproblems

durch das Attribut Kategorie

Selbsttestaufgabe 5.4 macht deutlich, dass die Wichtigkeit eines Attributs ein

relativer Begriff ist und sehr stark von der aktuellen Beispielmenge, die noch zu

klassifizieren ist, abhangt. So ist das Attribut Kategorie als erste Abfrage fur die

gesamte Beispielmenge

ziemlich nutzlos, wie dies in Abbildung 5.4(b)

illustriert ist. Andererseits hat gerade dieses Attribut fur die ubrig gebliebene Bei-

spielmenge

{

X 1 ,...,X 15 }

unter allen ubrig gebliebenen Attributen

gemaß Selbsttestaufgabe 5.4 die großte Wichtigkeit.

Nachdem das erste Attribut als Markierung des Wurzelknotens des zu generie-

renden Entscheidungsbaumes ausgewahlt worden ist, erhalten wir fur jede der durch

die verschiedenen Attributwerte bestimmten Teilmengen der Trainingsmenge wie-

der eine Instanz des Lernproblems fur Entscheidungsbaume. Dabei gibt es jeweils

weniger Trainingsbeispiele und eine um ein Attribut verringerte Attributmenge. Es

sind vier Falle fur diese rekursiven Lernprobleminstanzen zu unterscheiden.

{

X 1 ,X 3 ,X 6 ,X 7 ,X 8 ,X 9 ,X 14 }

1. Falls die Menge der Beispiele leer ist, bedeutet dies, dass kein Beispiel mit

der entsprechenden Attribut-Werte-Kombination in der ursprunglichen Trai-

ningsmenge vorhanden war. In diesem Fall konnte man eine Defaultklassifi-

kation angeben; im Folgenden nehmen wir an, dass als Defaultwert diejenige

Klassifikation - bezeichnet durch MajorityVal(E) - genommen wird, die auf

die Mehrzahl der Beispiele E an dem Elternknoten gegeben ist. Dieser Fall

tritt in Abbildung 5.5 bei dem Attributwert Kategorie = SF auf. Da die

Beispielmenge E =

an den Elternknoten vier positi-

ve Beispiele und nur ein negatives Beispiel enthalt, ist MajorityVal(E) = ja ,

und dies wurde als Defaultklassifikation fur den Attributwert Kategorie = SF

an dieser Stelle ausgegeben.

(Fur den Fall, dass E genauso viele positive wie negative Beispiele enthalt,

konnte man vereinbaren, dass MajorityVal(E) eine positive Klassifikation lie-

fert.)

{

X 2 ,X 5 ,X 10 ,X 11 ,X 15 }

2. Falls alle Beispiele die gleiche Klassifikation aus

haben, wird diese

Klassifikation ausgegeben. In Abbildung 5.4(c) wird dies durch den Fall fur

allein illustriert.

{

ja , nein

}

Methoden Wissensbasierter Systeme

Search WWH ::

Custom Search

Home