Database Reference
In-Depth Information
Abstrakt konnte man die Aufgabe eines Agenten wie folgt formulieren: Fuhre
Umgebungszustande herbei, die den Nutzen maximieren. Der Nutzen u kann dabei
eine auf den Umgebungszustanden E definierte lokale Funktion
u : E
→ R
oder eine auf den Laufen
R
definierte globale Funktion
u :
R→R
sein. Eine lokal definierte Nutzenfunktion konnte im Thermostat-Beispiel etwa auf
dem Abstand zwischen der Raumtemperatur und der Zieltemperatur basieren: Je
kleiner der Abstand, desto großer der Nutzen. Zur Illustration einer globalen Nut-
zenfunktion greifen wir das Beispiel unseres Agenten DJames wieder auf.
Beispiel 12.13 (DJames 2) Die Tatigkeit von DJames (vgl. Beispiel 12.3) konn-
te man nach einem Bonuspunktesystem bewerten, wobei es fur jede eingesammelte
CD, DVD oder Hulle einen Punkt gibt. Da mehrere Personen diese immer wieder
im Haushalt herumliegen lassen (und manchmal sogar auch wieder wegraumen!),
ist die Umgebung fur den Agenten DJames eine offene, dynamische Umgebung.
Die Erfolgsquote von DJames fur einen Lauf r konnte man durch
u(r)= Anzahl der von DJames in r eingesammelten CDs, DVDs und Hullen
Anzahl der von anderen in r liegengelassenen CDs, DVDs und Hullen
messen. Auch wenn dies ein recht einfacher Ansatz ist, so kann man damit schon
wichtige Verhaltensweisen von Agenten studieren:
Kann der Agent auf Anderungen in seiner Umgebung reagieren?
Wenn DJames auf dem Weg ins Arbeitszimmer ist und feststellt, dass dort
gerade alle herumliegenden CDs und DVDs weggeraumt worden sind, sollte
er sich einem anderen Raum zuwenden.
Kann der Agent gunstige Gelegenheiten erkennen und nutzen?
Werden zu einem Zeitpunkt etwa gerade eine ganze Reihe von CDs z.B. im
Wohnzimmer liegengelassen, so ware es unter Umstanden sinnvoll, den aktu-
ell bestehenden Aufraumplan zu andern und zunachst im Wohnzimmer fur
Ordnung zu sorgen.
In beiden Fallen deckt sich der subjektive Eindruck eines sinnvollen, angemessenen
Verhaltens von DJames mit einer objektiv messbaren Steigerung des Nutzens u(r).
Naturlich konnte die Nutzenfunktion u noch weiter verfeinert werden, etwa durch
eine hohere Bewertung von CDs und DVDs gegenuber Hullen oder durch Zusatz-
punkte fur eingesammelte Paare von CDs/DVDs und den zugehorigen Hullen.
Ein optimaler Agent ist nun ein Agent, der den (erwarteten) Nutzen uber die
Menge der moglichen Laufe maximiert. Sei P (r
Ag , Env ) die Wahrscheinlichkeit,
dass der Lauf r in der Umgebung Env vom Agenten Ag absolviert wird. Dann gilt:
|
P (r
|
Ag, Env)=1
r∈R(Ag,Env)
Search WWH ::




Custom Search