Information Technology Reference
In-Depth Information
Die Bank steht also vor dem Problem, einen potentiellen Kreditnehmer entweder der Klas-
se der problemlosen Kreditnehmer zuzuordnen und den Kredit zu vergeben oder ihn der
Klasse der Problemfälle zuzuordnen und auf das Kreditgeschäft zu verzichten bzw. eine
genauere Prüfung vorzunehmen. In diesem Anwendungsfall kann die Bank auf ein Daten-
material zurückgreifen, bei der jeder Kunde durch 20 Merkmale charakterisiert ist. Die
Merkmale sind teilweise qualitativer Natur (Beruf, Zahlungsmoral, etc.), überwiegend
aber ursprünglich metrisch, wenn auch nur in diskretisierter Form erfasst. Es liegt eine ge-
schichtete Stichprobe mit 700 „guten“ und 300 „schlechten“ Fällen vor. Insofern liegt die
Problemstellung darin, ein neues Objekt (Kundenantrag) aufgrund von Merkmalen einer
Klasse von bekannten und bereits klassifizierten Objekten (Datenmaterial) zuzuordnen.
Diese Problemstellung entspricht genau den Zielen der Diskriminanzanalyse, bei der es
ebenfalls darum geht, eine bereits bekannte Objektgruppe (Klassen/Cluster) anhand ihrer
Merkmale zu charakterisieren und zu unterscheiden sowie neue Objekte in diese Klassen
einzuordnen. Eine solche Diskriminanzanalyse fällt folglich unter die sogenannten Klas-
sifikations - oder auch Mustererkennungsmethoden (pattern recognition). Rein formal lässt
sich diese Vorgehensweise wie folgt ausdrücken:
Eine Grundgesamtheit W bestehe aus mehreren Klassen (Gruppen) C 1 , …, C k , so dass
jedes Element (Objekt) w ∈ W zu genau einer Gruppe gehört. Für die Zerlegung C 1 ,…, C k
von W gelte also C i ∩ C j = Ø für i
und UC
j=1
⋅ =Ω . Ziel ist es, für ein Objekt w ∈ Ω
mit unbekannter Klassenzugehörigkeit anhand eines beobachteten Merkmalsvektors x die
zugehörige Klasse C j zu ermitteln.
In der Diskriminanzanalyse werden in der Regel nicht die Klassen selbst, sondern nur
bestimmte Merkmale der Objekte beobachtet, anhand derer die Klassenzugehörigkeit fest-
zustellen ist. Um typische Werte der Merkmale für die verschiedenen Klassen zu ermit-
teln, steht eine Stichprobe von Objekten zu Lernzwecken zur Verfügung, für welche die
Merkmalsausprägungen und die Klassenzugehörigkeit bekannt sind. Letzteres ist notwen-
dig, um die Entscheidungsfunktion zu entwickeln, die jedes Objekt eindeutig einer Klasse
zuordnet. Eine solche Funktion ist in der Regel nicht gegeben, sondern muss aus den gege-
benen Daten der Stichprobe entwickelt werden und zwar so, dass die Wahrscheinlichkeit
einer Fehlklassifikation oder die Kosten einer Fehlklassifikation minimiert werden. Eine
solche Regel, nach der Objekte zu den einzelnen Klassen zugeordnet werden, basiert auf
einer sogenannten Diskriminanzfunktion . Auch eine solche Diskriminanzfunktion in Form
einer Diskriminanzregel lässt sich formalisieren:
Betrachtet wird ein Modell der Diskriminanzanalyse wie in der obigen Definition an-
gegeben. Zu einem Objekt w werde ein Merkmalsvektor x beobachtet. Eine Funktion D,
die dem Beobachtungsvektor x für jede Gruppe C i der Grundgesamtheit einen charakte-
risierenden Wert D(x, C i ) zuordnet, heißt Diskriminanzfunktion. Eine Regel, die anhand
von D(x, C 1 ),…, D(x, C k ) entscheidet, welcher Gruppe C i das Objekt w zugeordnet wird,
heißt Diskriminanzregel.
In der jeweiligen Fachliteratur zur Diskriminanzanalyse lassen sich verschiedene, in
der Praxis bewährte Ansätze (z. B. entscheidungstheoretische Ansätze, Fischer-Ansatz
etc.) finden, die alle, grob betrachtet, auf die resultierende Diskriminanzfunktion hinfüh-
k
Search WWH ::




Custom Search