Mehrschichtige Perzeptren - Computational Intelligence

Information Technology Reference

In-Depth Information

se Summe der Fehlerquadrate gilt es durch geeignete Veränderungen der Gewich-

te und der Parameter der Aktivierungsfunktionen zu minimieren. Dies führt uns

zu der in der Analysis und Statistik wohlbekannten Methode der kleinsten Quadrate ,

auch Regression genannt, zur Bestimmung von Ausgleichsgeraden (Regressionsge-

raden) und allgemein Ausgleichspolynomen für eine gegebene Menge von Daten-

punkten ( x i , y i ).DieseMethodeistinAbschnittA.2rekapituliert.

Hier interessieren uns zwar nicht eigentlich Ausgleichsgeraden oder Ausgleichs-

polynome, aber die Bestimmung eines Ausgleichspolynoms lässt sich auch zur Be-

stimmung anderer Ausgleichsfunktionen verwenden, nämlich dann, wenn es ge-

lingt, eine geeignete Transformation zu finden, durch die das Problem auf das Pro-

blem der Bestimmung eines Ausgleichspolynoms zurückgeführt wird. So lassen sich

z. B. auch Ausgleichsfunktionen der Form

y = ax b

durch die Bestimmung einer Ausgleichgeraden finden. Denn logarithmiert man die-

se Gleichung, so ergibt sich

ln y = ln a + b · ln x .

Diese Gleichung können wir durch die Bestimmung einer Ausgleichsgeraden behan-

deln. Wir müssen lediglich die Datenpunkte ( x i , y i ) logarithmieren und mit den so

transformierten Werten rechnen. 4

In dem Zusammenhang mit (künstlichen) neuronalen Netzen ist wichtig, dass es

auch für die sogenannte logistische Funktion

Y

1 + e a + bx ,

y =

wobei Y , a und b Konstanten sind, eine Transformation gibt, mit der wir das Pro-

blem der Bestimmung einer Ausgleichsfunktion dieser Form auf die Bestimmung ei-

ner Ausgleichsgerade zurückführen können (sogenannte logistische Regression ). Dies

ist wichtig, weil die logistische Funktion eine sehr häufig verwendete Aktivierungs-

funktion ist (siehe auch Abschnitt 5.4). Wenn wir über eine Methode zur Bestim-

mung einer logistischen Ausgleichsfunktion verfügen, haben wir unmittelbar eine

Methode zur Bestimmung der Parameter eines zweischichtigen Perzeptrons mit ei-

nem Eingang, da wir ja mit dem Wert von a den Biaswert des Ausgabeneurons und

mit demWert von b das Gewicht des Eingangs haben.

Wie kann man aber die logistische Funktion „linearisieren“, d. h. , so umformen,

dass das Problem auf das Problem der Bestimmung einer Ausgleichsgerade zurück-

geführt wird? Wir beginnen, indem wir den Reziprokwert der logistischen Glei-

chung bestimmen:

1 + e a + bx

Y

1

y =

.

4 Man beachte allerdings, dass bei einem solchen Vorgehen zwar die Fehlerquadratsumme im trans-

formierten Raum (Koordinaten x

= ln x und y

= ln y ), aber damit nicht notwendig die Fehlerquadrat-

summe im Originalraum (Koordinaten x und y )minimiertwird.DennochführtderAnsatzmeistzusehr

guten Ergebnissen.

Computational Intelligence

Search WWH ::

Custom Search

Home