Information Technology Reference
In-Depth Information
Die Durchführung des genetischen Algorithmus basiert auf den Daten des oben be-
schriebenen Anwendungsfalls. Zur Validierung, ob eine berechnete Lösung des Algorith-
mus auch den Anforderungen entspricht, werden neben den Trainingsdaten auch Testdaten
benötigt. Im Gegensatz zur Clusteranalyse, die lediglich eine Einordnung der vorhandenen
Daten liefern soll, ist es schließlich Ziel der Diskriminanzanalyse, nach der Ermittlung der
Entscheidungsfunktion für weitere, neue und bisher unbekannte Datenkonstellationen an-
wendbar zu sein. Durch die Überprüfung mit Testdaten ist insbesondere auch sicherzustel-
len, dass keine unerwünschte Überanpassung stattgefunden hat. Da in diesem Abschnitt al-
lerdings nur die Ermittlung der Diskriminanzfunktion im Fokus steht, wird auf eine solche
Überprüfung verzichtet. An dieser Stelle gilt es darauf hinzuweisen, dass es im Umfeld des
Data Mining nicht auf die Datenquantität ankommt, sondern vielmehr die Datenqualität
über den Erfolg oder Misserfolg eines generischen Algorithmus entscheidet. Insofern ist
darauf zu achten, dass man auf eine repräsentative Stichprobe aus der oftmals umfangrei-
chen Datenmenge zugreifen kann. Ein Objekt der Klasse Testdaten enthält die Daten,
die aus der Datei kreditcore.dat eingelesen werden. Obwohl die Testdaten im vor-
liegenden Fall ganzzahliger Natur sind, wurde als Typ double gewählt, um gegebenen-
falls weitere Typen auch ohne dedizierte Typumwandlung verarbeiten zu können.
Die im Folgenden für die diskreten Merkmale angegebene und in den Dateien enthal-
tene Punktebewertung basiert auf der Einschätzung von erfahrenen Kreditsachbearbeitern
(Tab. 9.6 ).
Tab. 9.6 Kreditscoring zur Klassifikation von Kreditnehmern
Variable Beschreibung
Ausprägung
Punkte
Rel. Häufigk. in % bei
Schlecht
Gut
Kredit
Dummy-Variable:
1: Kredit wurde zurückgezahlt
0: Kredit wurde nicht ordnungsgemäß zurückgezahlt
Laufkont
Bestehendes
lfd. Konto bei
der Bank
Kein Kontostand bzw.
Debetsaldo
2
3500
23,43
0 < = … < 200 €
3
4,67
7,00
… > = 200 € oder Gehalts-
konto seit mind. 1 Jahr
4
15,33
49,71
Kein lfd. Konto
1
45,00
19,86
Laufzeit Laufzeit in Monaten (metrisch)
Dlaufzeit Laufzeit in
Monaten
(diskretisiert)
< = 6
10
3,00
10,43
6 < … < = 12
9
22,33
30,00
12 < … < = 18
8
18,67
18,71
18 < … < = 24
7
22,00
22,57
24 < … < = 30
6
6,33
5,43
30 < … < = 36
5
12,67
6,86
36 < … < = 42
4
1,67
1,71
42 < … < = 48
3
10,67
3,14
 
Search WWH ::




Custom Search