Information Technology Reference
In-Depth Information
In enger Anlehnung an die Diskriminanzanalyse nach Fisher wird von einer linearen
Diskriminanzfunktion ausgegangen: f(x) =
= 1 0
Allerdings werden die Koeffizienten a i , i = 0,…, n nicht mit statistischen Mitteln ge-
schätzt, sondern durch Ausprobieren ermittelt. Dabei gilt der Zusammenhang mit f(x) < 0,
dass x in die Gruppe 0 eingeordnet wird, ansonsten in Gruppe 1. Hierbei stehen zur Co-
dierung eines Koeffizienten 16 Bit zur Verfügung, d. h. man kann Zahlen von − 32768 bis
+ 32767 erzeugen. Die Zahlen lassen sich anpassen, indem man die Werte durch 2 15 teilt
und damit Koeffizienten zwischen − 1 und + 1 erhält. Mit diesen insgesamt 2 16 möglichen
Zahlenwerten für 21 Koeffizienten hat der Suchraum dann einen Umfang von (2 16 ) 21 Ele-
menten. Bei der Wahl von 25 Koeffizienten käme man schon auf einen Wert von 2 400 , der
in etwa der Anzahl der möglichen Stellungen beim Schachspiel entspricht.
Das Ziel der Diskriminanzanalyse ist die Ermittlung einer Zuordnungsvorschrift, mit
der möglichst viele Werte der passenden Gruppe zugeordnet werden. Deshalb ist die
nächstliegende Möglichkeit, die Qualität einer Diskriminanzfunktion zu bewerten, dass
man die Anzahl der korrekt zugeordneten Datensätze aus der Stichprobe zählt. Setzt man
diesen Wert ins Verhältnis zur Anzahl der Datensätze, erhält man einen Fitnesswert zwi-
schen 0 und 100, wobei 100 bedeutet, dass alle Datensätze korrekt zugeordnet werden.
Im Prinzip ist dieser Wert ein Maß für die Trefferwahrscheinlichkeit. Eine weitere Be-
wertungsfunktion bietet sich an, indem man die Anzahl der richtig zugeordneten Sätze
pro Gruppe ermittelt, die Zuordnungsquoten verschieden gewichtet und dabei die erwar-
teten Kosten einer Fehlklassifikation mit einrechnet. Da in diesem Anwendungsfall keine
Kostenangaben vorliegen, bietet sich die erstgenannte Methode an. Nach der Ermittlung
der Funktionskoeffizienten lässt sich zu sämtlichen Stichprobensätzen die Klassenzuge-
hörigkeit berechnen. Ist dieser Wert gleich der tatsächlichen Klassenzugehörigkeit, wird
ein Zähler hochgesetzt. Dieser Zähler, geteilt durch den Stichprobenumfang (und mit 100
multipliziert), wird als Fitnesswert von der Funktion zurückgeliefert.
n
a
xa
k
k
k
Search WWH ::




Custom Search