Information Technology Reference
In-Depth Information
se Summe der Fehlerquadrate gilt es durch geeignete Veränderungen der Gewich-
te und der Parameter der Aktivierungsfunktionen zu minimieren. Dies führt uns
zu der in der Analysis und Statistik wohlbekannten Methode der kleinsten Quadrate ,
auch Regression genannt, zur Bestimmung von Ausgleichsgeraden (Regressionsge-
raden) und allgemein Ausgleichspolynomen für eine gegebene Menge von Daten-
punkten ( x i , y i ).DieseMethodeistinAbschnittA.2rekapituliert.
Hier interessieren uns zwar nicht eigentlich Ausgleichsgeraden oder Ausgleichs-
polynome, aber die Bestimmung eines Ausgleichspolynoms lässt sich auch zur Be-
stimmung anderer Ausgleichsfunktionen verwenden, nämlich dann, wenn es ge-
lingt, eine geeignete Transformation zu finden, durch die das Problem auf das Pro-
blem der Bestimmung eines Ausgleichspolynoms zurückgeführt wird. So lassen sich
z. B. auch Ausgleichsfunktionen der Form
y = ax b
durch die Bestimmung einer Ausgleichgeraden finden. Denn logarithmiert man die-
se Gleichung, so ergibt sich
ln y = ln a + b · ln x .
Diese Gleichung können wir durch die Bestimmung einer Ausgleichsgeraden behan-
deln. Wir müssen lediglich die Datenpunkte ( x i , y i ) logarithmieren und mit den so
transformierten Werten rechnen. 4
In dem Zusammenhang mit (künstlichen) neuronalen Netzen ist wichtig, dass es
auch für die sogenannte logistische Funktion
Y
1 + e a + bx ,
y =
wobei Y , a und b Konstanten sind, eine Transformation gibt, mit der wir das Pro-
blem der Bestimmung einer Ausgleichsfunktion dieser Form auf die Bestimmung ei-
ner Ausgleichsgerade zurückführen können (sogenannte logistische Regression ). Dies
ist wichtig, weil die logistische Funktion eine sehr häufig verwendete Aktivierungs-
funktion ist (siehe auch Abschnitt 5.4). Wenn wir über eine Methode zur Bestim-
mung einer logistischen Ausgleichsfunktion verfügen, haben wir unmittelbar eine
Methode zur Bestimmung der Parameter eines zweischichtigen Perzeptrons mit ei-
nem Eingang, da wir ja mit dem Wert von a den Biaswert des Ausgabeneurons und
mit demWert von b das Gewicht des Eingangs haben.
Wie kann man aber die logistische Funktion „linearisieren“, d. h. , so umformen,
dass das Problem auf das Problem der Bestimmung einer Ausgleichsgerade zurück-
geführt wird? Wir beginnen, indem wir den Reziprokwert der logistischen Glei-
chung bestimmen:
1 + e a + bx
Y
1
y =
.
4 Man beachte allerdings, dass bei einem solchen Vorgehen zwar die Fehlerquadratsumme im trans-
formierten Raum (Koordinaten x
= ln x und y
= ln y ), aber damit nicht notwendig die Fehlerquadrat-
summe im Originalraum (Koordinaten x und y )minimiertwird.DennochführtderAnsatzmeistzusehr
guten Ergebnissen.
Search WWH ::




Custom Search