Information Technology Reference
In-Depth Information
Tab. 9.7 Auszug aus dem Kreditscoring zur Klassifikation von Kreditnehmern
Variable
Beschreibung Ausprägung
Punkte
Rel. Häufigk. in % bei
Dhoehe
Darlehens-
höhe in €
(diskretisiert)
< = 500
10
1,00
2,14
500 < … < = 1000
9
11,33
9,14
1000 < … < = 1500
8
17,00
19,86
1500 < … < = 2500
7
19,67
24,57
2500 < … < = 5000
6
25,00
28,57
5000 < … < = 7500
5
11,33
9,71
7500 < … < = 10.000
4
6,67
3,71
10.000 < … < = 15.000 3
7,00
2,00
15000 < … < = 20.000 2
1,00
0,29
> 20.000
1
0,00
0,00
zu beachten, dass der genetische Algorithmus nicht den Anspruch erhebt, die optimalste
Regel in Form eines Individuums zu finden, sondern sich eher darauf konzentriert, viele
klare Zusammenhänge in Form vollständiger Populationen aufzeigen zu können. Inso-
fern kann es sich bei einer solchen überlebensfähigen Population durchaus um ein lokales
Optimum handeln.
Bereits bei der Konzeptionalisierung gilt es, sich Gedanken darüber zu machen, wie
komplex die zu findenden Regeln sein müssen. So lassen sich logische Verknüpfungen,
wie beispielsweise UND/ODER beliebig schachteln, Vergleiche mit Konstanten oder Ver-
gleiche der Attribute untereinander durchführen oder aber arithmetische Berechnungen
anstellen. So lassen sich beispielsweise mathematische oder statistische Funktionen auf
einzelne Datensätze oder den Gesamtdatenbestand beziehen. Mit diesen Elementen lässt
sich eine beliebige Komplexität abbilden, die natürlich zu einer enormen Größe des Such-
raums führt und damit eine Herausforderung an die Codierung und Auswertung eines
genetischen Algorithmus darstellt. Ein minimalistischer Ansatz für eine Assoziationsregel
sieht dann nur nicht den Vergleich mit Konstanten und die Verknüpfung dieser Vergleiche
mit UND vor. Da für jedes Attribut Kleiner-, Größer- und Gleich-Beziehungen existieren
können, lässt sich das auf die Anordnung jedes Attributes in einem Intervall abbilden. Die-
ses Intervall kann dabei durchaus leer sein, nur ein Element beinhalten und auf einer oder
beiden Seiten unendlich sein. So lautet beispielsweise für die Regel A > 1 AND a > 2 das
Intervall A ∈ [1; 2] oder für A > 1 folglich A ∈ [1;∞]. Für jedes Attribut sind also zunächst
die beiden Intervallgrenzen im Chromosom darzustellen. Gleichfalls gilt es einen Wert für
„Unendlich“ festzulegen. Jedes Attribut kann entweder auf der linken oder rechten Seite
der Regel erscheinen.
Zur Illustration des Regelaufbaus dient obiger Auszug aus dem Kreditscoring (Tab. 9.7 ):
Ein Regelbestandteil 2 ≤ dhöhe ≤ 5 ist zu deuten, dass sich die Darlehenshöhe zwi-
schen 5000 und 20.000 € bewegt. Durch die Diskretisierung der Merkmale gibt es in
diesem Regelfall jeweils einen minimalen und einen maximalen Wert.
 
Search WWH ::




Custom Search