Information Technology Reference
In-Depth Information
Mit Hilfe von entscheidungstheoretischem Planen können auch in nicht-determinis-
tischen Umgebungen optimale Interoperationsstrategien berechnet und im Rahmen von
Entscheidungsprozessen in konkrete Interoperationen überführt werden. Ein solcher Ent-
scheidungsprozess gestaltet sich bekanntlich durch eine endliche Menge von diskreten
Zuständen, eine endliche Menge von Aktionen, eine Zustandsübergangsfunktion, die für
jeden Zustand und für jede Aktion eine Wahrscheinlichkeitsverteilung über alle Zustände
angibt und letztlich eine Belohnungsfunktion sowie eine Kostenfunktion. Dem allem liegt
die Annahme zugrunde, dass die Informationen über die aktuelle Situation dahingehend
ausreichend sind, um Vorhersagen über die Zukunft zu machen. Auf Basis dieser Informa-
tionen lassen sich dann optimale Verhaltensstrategien ableiten. Entgegen der klassischen
Verhaltensplanung lassen sich diese Strategien allerdings nicht einfach als Wirkungen von
Interoperationen beschreiben. Zum einen werden die Effekte von Interoperationen als
nicht-deterministisch angenommen und zum anderen muss man berücksichtigen, dass der
Agent während der Ausführung der Interoperation oder ganzer Interoperationsketten neue
Informationen über die von ihm und den anderen Agenten beeinflusste Umgebung erhält,
die dann wiederum die Interoperationsauswahl beeinflussen wird. Der Agent entschei-
det sich je nach aktuellem Zustand für die Interoperation, die den höchsten erwarteten
Nutzen bringt. Problematisch ist an diesem Ansatz jedoch, dass die hierfür notwendigen
Algorithmen alle Zustände explizit berechnen müssen, wobei die Anzahl der Zustände
exponentiell mit der Anzahl der Eigenschaften wächst. Daher wird versucht, Algorith-
men zur Berechnung einer optimalen Verhaltensstrategie zu entwickeln, die keine expli-
zite Aufzählung aller Zustände benötigen. Solche Algorithmen verfolgen das Prinzip zur
Lücke, indem sie realen Problemen und Domänen eine Struktur unterstellen. Sie machen
sich zunutze, dass viele reale Probleme eine Struktur besitzen. Diese Unterstellung führt
dann beispielsweise zu der Annahme, dass Interoperationen in vielen Zuständen dieselben
Effekte erzielen, eine Belohnungsfunktion gleich für viele Zustände gewählt werden kann
und die Kostenfunktion oft nicht vom aktuellen Zustand, sondern nur von der jeweiligen
Interoperation abhängt.
Für deterministische als auch für nicht-deterministische Domänen lassen sich optimale
Verhaltensstrategien aus den Problemrepräsentationen ableiten und in Entscheidungsbäu-
men relativ effizient darstellen, speichern und verarbeiten. Ein Entscheidungsbaum ist
eine Datenstruktur, die zur Steuerung der Suche in einem Problemlöseverfahren dient. Sie
lassen sich dann gut einsetzen, wenn die Suche in einer Folge diskreter Einzelentscheidun-
gen besteht, wobei in jedem Schritt eine Möglichkeit aus einer kleinen Menge von Alter-
nativen ausgewählt werden kann. Solche Strategien haben den Nachteil, dass für deren
Erstellung die Ziele bekannt und konsistent sein müssen. Konflikte zwischen Zielen so-
wie unterschiedlich wichtige Ziele können in der Regel nicht berücksichtigt werden. Zur
Repräsentation nicht-deterministischer Aktionen wurden unter anderem auch Bayessche
Netze eingesetzt. Die bedingten Wahrscheinlichkeiten der Bayes-Netze können dabei als
Entscheidungsbäume kompakt repräsentiert werden. Auch die Belohnungs- und Kosten-
funktion sowie Strategie- und Wertefunktion können als Entscheidungsbäume übersicht-
lich und effizient repräsentiert werden.
Search WWH ::




Custom Search