Information Technology Reference
In-Depth Information
Um die Matrixschreibweise der Gewichte zu illustrieren, stellen wir die Verbin-
dungsgewichte dieses Netzes durch zwei Matrizen dar. Wir erhalten
22
2
W 1 =
und
W 2 =
22
,
2
wobei die Matrix W 1 für die Verbindungen von der Eingabeschicht zur versteckten
Schicht und die Matrix W 2 für die Verbindungen von der versteckten Schicht zur
Ausgabeschicht steht.
Als weiteres Beispiel betrachten wir das Fredkin-Gatter ,dasindersogenannten
konservativen Logik 1 eine wichtige Rolle spielt [Fredkin u. Toffoli 1982]. Dieses Gatter
hat drei Eingänge: s , x 1 und x 2 ,unddreiAusgänge: s , y 1 und y 2 (siehe Abbildung 5.5).
Die „Schaltervariable“ s wird stets unverändert durchgereicht. Die Eingänge x 1 und
x 2 werden entweder parallel oder gekreuzt auf die Ausgänge y 1 und y 2 geschaltet,
je nachdem, ob die Schaltervariable s den Wert 0 oder den Wert 1 hat. Die von ei-
nem Fredkin-Gatter berechnete Funktion ist in Abbildung 5.5 als Wertetabelle und
in Abbildung 5.6 geometrisch dargestellt.
Abbildung 5.7 zeigt ein dreischichtiges Perzeptron, das die Funktion des Fred-
kin-Gatters (ohne die durchgereichte Schaltervariable s )berechnet.Esisteigentlich
aus zwei getrennten dreischichtigen Perzeptren zusammengesetzt, da es von kei-
nem Neuron der versteckten Schicht Verbindungen zu beiden Ausgabeneuronen
gibt. Das muss natürlich nicht immer so sein.
Zur Illustration der Matrixschreibweise der Gewichte stellen wir auch die Ge-
wichte dieses Netzes durch zwei Matrizen dar. Wir erhalten
2 20
220
022
0
2020
0202
W 1 =
W 2 =
und
,
22
wobei die Matrix W 1 wieder für die Verbindungen von der Eingabeschicht zu der
versteckten Schicht und die Matrix W 2 für die Verbindungen von der versteckten
Schicht zur Ausgabeschicht steht. Man beachte, dass in diesen Matrizen fehlende
Verbindungen durch Nullgewichte dargestellt sind.
Mit Hilfe der Matrixschreibweise der Gewichte kann man übrigens leicht zei-
gen, warum sigmoide oder allgemein nichtlineare Aktivierungsfunktionen für die
Berechnungsfähigkeiten eines mehrschichtigen Perzeptrons wichtig sind. Sind näm-
lich alle Aktivierungs- und Ausgabefunktionen linear, also Funktionen f act (net, )=
net ,solässtsicheinmehrschichtigesPerzeptronaufeinzweischichtiges(nur
Ein- und Ausgabeschicht) reduzieren.
Wie oben erwähnt, ist für zwei aufeinanderfolgende Schichten U 1 und U 2
net U 2 = W · in U 2 = W ·
out U 1 .
1 Die konservative Logik ist ein mathematisches Modell für Berechnungen und Berechnungsfähigkei-
ten von Computern, in dem die grundlegenden physikalischen Prinzipien, denen Rechenautomaten un-
terworfen sind, explizit berücksichtigt werden. Zu diesen Prinzipien gehört z.B., dass die Geschwindig-
keit, mit der Information übertragenwerden kann, sowie die Menge an Information, die in einemZustand
eines endlichen Systems gespeichert werden kann, endlich sind [Fredkin u. Toffoli 1982].
Search WWH ::




Custom Search