Kapitel 1 - Intelligente Agenten und Problemtypen
Was macht einen "idealen rationalen Agenten" aus?
Er wählt für jede Wahrnehmungsfolge immer den optimalen nächsten Schritt. Die
Festlegung dieser Aktionen (Agentenentwurf) ist eine ideale Abbildung von
Wahrnehmungsfolgen auf Aktionen. Der Agent kann auf eingebauten Wissen über seine
Umgebung und/oder seiner Erfahrung beruhen.
Was bedeutet eigentlich rational in Bezug auf Agenten?
Dies kann nur für einen bestimmten Zeitpunkt beschrieben werden. Vier Merkmale
sind dafür maßgebend:
- Das Performancemaß, das den Grad des Erfolges definiert.
- All das, was der Agent wahrgenommen hat (Wahrnehmungsfolge).
- Das was der Agent über die Umgebung weiß.
- Und die Aktionen, die der Agent ausführen kann.
Was ist ein Agentenprogramm?
Ist eine Funktion, welche die Abbildung von Wahrnehmungsfolgen auf Aktionen
implementiert. Die Recheneinheit, auf der das Programm läuft, wird Architektur
genannt. Diese stellt über Sensoren Informationen zur Verfügung und überträgt die
gewählten Aktionen auf die Effektoren.
Nachteile von Lookup-Programmen sind die extrem langen Tabellen und der hohe
Zeitaufwand. Es herrscht außerdem keinerlei Autonomie (Erfahrungsabhängigkeit) und
somit Unflexibilität bei Umweltänderungen. Selbst wenn der Agent Lernfähig wäre,
müßte er stetig Einträge für seine Tabelle lernen.
Was ist der unterschied zwischen reflexiven und beobachtenden Agenten?
|
reflexiv
|
beobachtend
|
- der Agent erfasst Daten aus seiner Umwelt
- der Agent hat keinen Gedächtnisspeicher
|
- der Agent benutzt internen Zustand, um zu entscheiden
- dieser wird von der Umwelt strukturiert, bleibt ihr aber verborgen
|
|
Was sind einfache Reaktive Agenten?
Einfache reaktive Agenten werden auch als Reflexive Agenten
bezeichnet. "Wenn das Auto vor uns bremst, dann leite Bremsvorgang ein." einfache
reaktive Agenten reagieren also nur auf spzielle Beobachtungen. Sie haben
kein Gedächtnis und müssen daher oft Zufallsentscheidungen
treffen.
Worin bestehen beobachtende Agenten?
Diese Agenten beobachten ihre Umwelt und arbeiten somit mit einer
adaptivierten Bewertungsfunktion. So kommt es zu einer regelmäßigen Aktualisierung
des internen Zustandes. Sie benötigen Informationen, wie sich die Umwelt unabhängig
vom Agenten verändert und entwickelt. Agenten die die Welt beobachten sind auch
reflexive Agenten.
Was sind Zielbasierte Agenten?
Um im Falle unterschiedlich möglicher Folgezustände die richtige zu wählen,
benötigt der zielbasierte Agent Informationen über Ziele. Der Agent vergleicht
diese Information mit dem möglichem Ergebnis und wählt so die optimale Aktion aus.
Dies ist meist nicht mit einem Schritt sinnvoll möglich, sondern nur mit mehreren
Ermittlung solcher Aktionsfolgen über Suchen und Planen.
Was sind Nutzenbasierte Agenten?
Der Nutzen ist eine Abbildung der Menge der Zustände in die reellen Zahlen.
Die zugeordnete Zahl beschreibt, wie günstig der Zustand für den Agenten ist. Um
ein Ziel zu erreichen, kann der Nutzen auf zwei Arten verwendet werden:
- Wenn es Ziele gibt, die einen Konflikt bilden, läßt sich mit Nutzen Trade-off
bestimmen
- Wenn es mehrere erstrebenswerte Ziele gibt, läßt sich mit Hilfe des Nutzens
die Wahrscheinlichkeit des Erreichens eines Ziels gegen seine Wichtigkeit
abwiegen
Ein Nutzenbasierter Agent muss auch Zielbasiert sein, da laut Definition
dieser mehrere Ziele hat und zwischen den verschiedenen Ebenen wechseln kann.
Welche Eigenschaften definieren Umgebungen?
-
Zugänglich - Unzugänglich
Eine Umgebung ist zugänglich, wenn der Agent über seine Sensoren alle
Informationen aus der Umwelt erfahren kann, die für die korrekte Ausführung
seiner Aktionen notwendig sind.
-
Deterministisch - indeterministisch
Eine Umgebung ist deterministisch, wenn der nächste Zustand vollständig durch
den aktuellen Zustand und den gewählten Aktionen definiert ist.
-
Episodisch - nicht episodisch
Eine Umgebung ist episodisch, wenn sich die Erfahrungen des Agenten in
unabhängige Episoden aufteilen lassen.
-
Statisch - dynamisch
Eine Umgebung ist dynamisch, wenn sie sich ändern kann, während der Agent noch
am "denken" ist. Semidynamisch bedeutet nur, dass die Ausführungszeit der
Aktionen beschränkt ist.
-
Diskret - kontinuierlich
Eine Umgebung heißt diskret, wenn es in ihr eine begrenzte und unterscheidbare
Anzahl von Wahrnehmungen und Aktionen gibt.
Was sind Umgebungsprogramme?
Sie stellen eine Simulationsumgebung dar, mit der Agentenprogramme getestet
werden können. Der Simulator nimmt einen oder mehrere Agenten als Eingabe und
stellt den Agenten die richtigen Wahrnehmungen zur Verfügung. Der Simulator nimmt
die Aktionen des Agenten entgegen und aktualisiert gegebenenfalls die Umgebung.
Eine Umgebung ist bestimmt durch ihren Anfangszustand und ihre
Update-Funktion.
Problemformulierung und Problemtypen
Was sind Problemlösende Agenten?
Die Zielformulierung, ausgehend von der aktuellen Situation, ist der
erste Schritt beim Problemlösen. Ein Ziel wird als eine Menge von Weltzuständen
betrachtet, in denen das Ziel erfüllt ist. Aktionen werden als Übergänge
zwischen Weltzuständen betrachtet. Bei der Problemformulierung wird entschieden,
welche Aktionen und welche Zustände betrachtet werden sollen. Sie folgt nach der
Zielformulierung. Hat ein Agent mehrere mögliche Aktionen mit unbekannten Ausgang,
kann er eine Entscheidung herbeiführen, indem er verschiedene mögliche
Aktionsfolgen, die zu dem gewünschten Zustand führen, untersucht und die Optimale
heraussucht
- Dieser Vorgang heißt Suche
- Problembeschreibung als Eingabe und Aktionsfolge als Ausgabe
- Die Lösung kann dann in der Ausführungsphase ausgeführt werden
Was gehört zur Problemformulierung?
Um ein Problem formulieren zu können, müssen Zustände bekannt und Aktionen
definiert werden. Dafür gibt es verschiedene Problemtypen.
Welche Problemtypen gibt es?
- Ein-Zustands-Probem
- Mehr-Zustands-Probem
- Kontingenz-Problem
- Explorations-Problem
Was ist ein Ein-Zustands-Probem?
Der Agent weiß, in welchem Zustand er sich befindet (d.h. die Umgebung
zugänglich) und was jede Aktion bewirkt. So kann er ausgehend von seinem Zustand,
für eine Aktionsfolge vorausberechnen, in welchem Zustand er sich nach der
Ausführung der Aktionen befinden wird.
Was wird zur Definition eines Ein-Zustand-Problems benötigt?
- Ein Anfangszustand
- Eine Menge möglicher Aktionen
- Ein Zielprädikat
- Eine Pfadkostenfunktion
Was ist ein Mehr-Zustands-Probem?
Der Agent weiß >nicht, in welchem Zustand er sich befindet (Umgebung
unzugänglich), aber er weiß was jede Aktion bewirkt. Dann kann er trotzdem das
Erreichen eines Zielzustandes vorausberechnen. Dazu muß er aber über eine Menge von
Zuständen schlußfolgern und nicht nur über Einen.
Was ist ein Kontingenz-Problem?
Der Agent kann nicht im voraus eine bestimmte Aktionsfolge berechnen, die zu
einem Zielzustand führt. Er benötigt während der Ausführung von Aktionen
Sensorinformationen, um zu entscheiden, welche der Aktionen zum Ziel
führt.
Statt einer Folge von Aktionen braucht er also einen Baum, in dem jeder Zweig von
der Wurzel zu einem Blatt eine Aktionsfolge darstellt. Jede Aktionsfolge behandelt
ein kontingentes Ereignis.
Was ist ein Explorations-Problem
Der Agent kennt die Auswirkungen seiner Aktionen nicht. Deshalb muß er
experimentieren, um herauszufinden, was die Aktionen bewirken und welche Art
von Zuständen es gibt. Dies kann er nur in der realen Welt tun. Dabei kann er aber
lernen, d.h. eine interne Repräsentation der Welt aufbauen und zur
Entscheidungsfindung nutzen. Eine Umgebung für so ein Problem zeichnet sich durch
eine dynamische Umwelt aus. Desweiteren müssen die Aktionen Freiheitsgrade
besitzen, um so näher an die reale Umwelt heranzureichen.
Kennt der Agent seinen Anfangszustand nicht oder hat dieser mehr als einen
Zustand, kann es kein Einzustandsproblem sein. Benötigt der Agent
Sensorinformationen, um schrittweise zu einem Ziel zu gelangen, kann es auch
kein Mehrzustandsproblem sein.
Somit bleiben Kontigenz- und Explorationsproblem. Ein Kontignenzproblem
besitzt ein festes Repertoire an Funktionen, deren Effekte eindeutig
definiert sind. Ein Explorationsproblem zeichnet sich dadurch aus, daß sich
der Agent vergangene Schritte merkt, aber sich nicht über die Auswirkungen
seiner Aktionen bewußt ist.
|
Was ist der Anfangszustand?
Der Anfangszustand ist der Zustand, von dem der Agent weiß, dass er sich in
Ihm befindet. Eine Aktion wird als Operator oder Nachfolgefunktion bezeichnet, in
Verbindung mit dem Zustand, zu dem sie von einem Gegebenen aus führt.
Was gehört zum Zustandsraum?
Der Anfangszustand und die Menge der Aktionen definieren den
Zustandsraum. Er besteht aus einer Menge aller Zustände, die vom Anfangszustand aus
durch bestimmt Aktionsfolgen, erreichbar sind.
Was ist ein Pfad im Zustandsraum?
Ein Pfad im Zustandsraum ist einfach nur eine Aktionsfolge, die von
einem Zustand in einen Anderen führt. Das Zielprädikat kann der Agent auf einen
Zustand anwenden, um zu Prüfen, ob e dieser ein Zielzustand ist. Die
Pfadkostenfunktion ordnet jedem Pfad im Zustandsraum einen Kostenwert zu. Dieser
ist die Summe der Kosten der einzelnen Aktionen entlang eines Pfades.
Was beinhaltet der Datentyp "Problem"?
Der Datentyp Problem ist also definiert durch Anfangszustand, Operatoren,
Zielprädikat und Pfadkostenfunktion. Instanzen dieses Datentyps bilden die Eingaben
für Suchalgorithmen. Die Ausgabe einer Suche ist dann eine Lösung, d.h. ein Pfad
von einem Ausgangszustand in einen Zustand, welcher das Zielprädikat erfüllt.
Wie sind Zustände im Mehrzustandsproblem definiert?
Beim Mehrzustandsproblem werden Zustände durch Zustandsmengen
und Aktionen durch Operatormengen ersetzt, welche die
Folgezustandsmenge spezifizieren. Ein Operator wird auf eine Zustandsmenge
angewandt, indem er auf jeden einzelnen Zustand angewendet wird und die Ergebnisse
vereinigt werden. Anstelle des Ergebnisraumes erhält man somit einen
Ergebnismengenraum.
Aus welchen Merkmalen wird die Performance einer Problemlösung angegeben?
- Wird eine Lösung gefunden?
- Wie hoch sind die Pfadkosten?
- Wie hoch sind die Suchkosten?
- Die Gesamtkosten sind die Summe aus Pfad- und Suchkosten.
Welche Typen gehören zum Beispielproblem des "8-Puzzle"?
Zustände
Beschreibung der Plazierung aller acht Plättchen sowie der Leerstelle.
Operatoren
Bewegung der Leerstelle nach links, rechts, oben oder unten.
Zielprädikat
Zustand mit gewünschter Plazierung der Plättchen.
Pfadkosten
Jeder Schritt hat Kosten von 1. Die Kosten eines Pfades sind somit gleich der
Pfadlänge.
|
|
|