Information Technology Reference
In-Depth Information
y 1
x 1
x 2
y 2
x n
y m
U ( 1 )
hidden
U ( 2 )
hidden
U ( r 2 )
hidden
U in
U out
Abbildung 5.1: Allgemeiner Aufbau eines r -schichtigen Perzeptrons.
Die Aktivierungsfunktion jedes versteckten Neurons ist eine sogenannte sigmoide Funkti-
on ,d.h.einemonotonwachsendeFunktion
f :IR [0, 1] mit
f ( x )=0 und
f ( x )=1.
lim
x
lim
x
Die Aktivierungsfunktion jedes Ausgabeneurons ist entweder ebenfalls eine sigmoide Funk-
tion oder eine lineare Funktion f act ( net, )= net .
Anschaulich bedeuten die Einschränkungen des Graphen, dass ein mehrschichti-
ges Perzeptron aus einer Eingabe- und einer Ausgabeschicht (den Neuronen der
Mengen U in bzw. U out )undkeiner,einerodermehrerenverstecktenSchichten(den
Neuronen in den Mengen U ( i )
hidden )besteht.Verbindungengibtesnurzwischenden
Neuronen benachbarter Schichten, also zwischen der Eingabeschicht und der ersten
versteckten Schicht, zwischen aufeinanderfolgenden versteckten Schichten und zwi-
schen der letzten verstecken Schicht und der Ausgabeschicht (siehe Abbildung 5.1).
Man beachte, dass ein mehrschichtiges Perzeptron nach dieser Definition immer
mindestens zwei Schichten — die Eingabe- und die Ausgabeschicht — besitzt.
Beispiele für sigmoide Aktivierungsfunktionen, die alle einen Parameter, näm-
lich einen Biaswert besitzen, zeigt Abbildung 5.2. Die Schwellenwertelemente aus
Kapitel 3 benutzen ausschließlich die Sprungfunktion als Aktivierungsfunktion. Die
Vo r t e i l e ande r e r Ak t i v i e rung s f unk t i onen we rden i n Ab s c hn i t t 5 . 2 b e sp r o c hen . An
dieser Stelle merken wir an, dass statt der angegebenen unipolaren sigmoiden Funk-
tionen (lim x f ( x )=0) oft auch bipolare sigmoide Funktionen (lim x f ( x )=
1) verwendet werden. Eine solche ist z. B. der tangens hyperbolicus (siehe Abbil-
dung 5.3), der mit der logistischen Funktion eng verwandt ist. Es ist außerdem klar,
dass sich aus jeder unipolaren sigmoiden Funktion durch Multiplikation mit 2 und
Abziehen von 1 eine bipolare sigmoide Funktion erhalten lässt.
Durch bipolare sigmoide Aktivierungsfunktionen ergibt sich kein prinzipieller
Unterschied. Wir beschränken uns daher in diesem Buch auf unipolare sigmoide Ak-
tivierungsfunktionen. Alle Betrachtungen und Ableitungen der folgenden Abschnit-
te lassen sich leicht übertragen.
Search WWH ::




Custom Search