Database Reference
In-Depth Information
Selbsttestaufgabe 12.5 (McClean 2) Geben Sie zu Beispiel 12.4 die Anzahl der
moglichen Umgebungszustande an.
Die Verbindung zwischen Umgebung und Aktionen stellt gerade der Agent
dar. Er entscheidet sich in jedem Umgebungszustand fur (genau) eine Aktion, und
die Umgebung befindet sich nach der Aktion in genau einem Zustand. Ein Lauf
r (run) eines Agenten in einer Umgebung ist also eine abwechselnde Folge von
Umgebungszustanden und Aktionen
... a n−1
a n+1
−→
a 0
−→
a 1
−→
a n
−→
...
die wir auch als r =(e 0 ,a 0 ,e 1 ,a 1 ...,a n ,e n+1 ,a n+1 ,...)schreiben.e 0 ist der Start-
zustand, und a n
r : e 0
e 1
−→
e n
e n+1
Ac ist die Handlung, fur die sich der Agent im Zustand e n
entscheidet und die in diesem Lauf zum Zustand e n+1 fuhrt. Wir fuhren die folgen-
den Bezeichnungen fur Mengen von Laufen ein:
R
Menge aller Laufe (uber E und Ac)
Ac
R
Menge aller Laufe, die mit einer Aktion enden
E Menge aller Laufe, die mit einem Umgebungszustand enden
Eine Zustandstransformationsfunktion
τ : R
R
→ 2 E
ordnet einem Lauf, der mit einer Aktion endet, eine Menge moglicher resultierender
Umgebungszustande zu. Die resultierenden Umgebungszustande hangen im Allge-
meinen nicht nur von der letzten Aktion, sondern von dem gesamten bisherigen
Lauf ab. Fur einen Lauf r : e 0
Ac
a n−1
−→
a 0
−→
a 1
−→
a n
−→ ∈ R
Ac enthalt
τ((e 0 ,a 0 ,...,e n ,a n )) die moglichen Zustande, die aus der Ausfuhrung von Akti-
on a n in Zustand e n in diesem Lauf resultieren konnen; es besteht also Unsicher-
heit uber den tatsachlich resultierenden Folgezustand. Die Zustandstransformati-
onsfunktion modelliert daher grundsatzlich Non-Determinismus , da mehrere mogli-
che Folgezustande zugelassen sind. Ist τ((e 0 ,a 0 ,...,e n ,a n )) =
e 1
...
e n
, so gilt der Lauf
als beendet .
Search WWH ::




Custom Search