Theme 1 Theme 3 Theme 4 Theme 5 Theme 7
Home Impressum Print  
 
Intelligente Agenten und Problemtypen

Kapitel 1 - Intelligente Agenten und Problemtypen

Was macht einen "idealen rationalen Agenten" aus?

Er wählt für jede Wahrnehmungsfolge immer den optimalen nächsten Schritt. Die Festlegung dieser Aktionen (Agentenentwurf) ist eine ideale Abbildung von Wahrnehmungsfolgen auf Aktionen. Der Agent kann auf eingebauten Wissen über seine Umgebung und/oder seiner Erfahrung beruhen.

Was bedeutet eigentlich rational in Bezug auf Agenten?

Dies kann nur für einen bestimmten Zeitpunkt beschrieben werden. Vier Merkmale sind dafür maßgebend:
  • Das Performancemaß, das den Grad des Erfolges definiert.
  • All das, was der Agent wahrgenommen hat (Wahrnehmungsfolge).
  • Das was der Agent über die Umgebung weiß.
  • Und die Aktionen, die der Agent ausführen kann.

Was ist ein Agentenprogramm?

Ist eine Funktion, welche die Abbildung von Wahrnehmungsfolgen auf Aktionen implementiert. Die Recheneinheit, auf der das Programm läuft, wird Architektur genannt. Diese stellt über Sensoren Informationen zur Verfügung und überträgt die gewählten Aktionen auf die Effektoren.

Nachteile von Lookup-Programmen sind die extrem langen Tabellen und der hohe Zeitaufwand. Es herrscht außerdem keinerlei Autonomie (Erfahrungsabhängigkeit) und somit Unflexibilität bei Umweltänderungen. Selbst wenn der Agent Lernfähig wäre, müßte er stetig Einträge für seine Tabelle lernen.

Was ist der unterschied zwischen reflexiven und beobachtenden Agenten?

reflexiv beobachtend
  • der Agent erfasst Daten aus seiner Umwelt
  • der Agent hat keinen Gedächtnisspeicher
  • der Agent benutzt internen Zustand, um zu entscheiden
  • dieser wird von der Umwelt strukturiert, bleibt ihr aber verborgen
Schema eines reflexiven Agenten

Was sind einfache Reaktive Agenten?

Einfache reaktive Agenten werden auch als Reflexive Agenten bezeichnet. "Wenn das Auto vor uns bremst, dann leite Bremsvorgang ein." einfache reaktive Agenten reagieren also nur auf spzielle Beobachtungen. Sie haben kein Gedächtnis und müssen daher oft Zufallsentscheidungen treffen.

Worin bestehen beobachtende Agenten?

Diese Agenten beobachten ihre Umwelt und arbeiten somit mit einer adaptivierten Bewertungsfunktion. So kommt es zu einer regelmäßigen Aktualisierung des internen Zustandes. Sie benötigen Informationen, wie sich die Umwelt unabhängig vom Agenten verändert und entwickelt. Agenten die die Welt beobachten sind auch reflexive Agenten.

Was sind Zielbasierte Agenten?

Um im Falle unterschiedlich möglicher Folgezustände die richtige zu wählen, benötigt der zielbasierte Agent Informationen über Ziele. Der Agent vergleicht diese Information mit dem möglichem Ergebnis und wählt so die optimale Aktion aus. Dies ist meist nicht mit einem Schritt sinnvoll möglich, sondern nur mit mehreren Ermittlung solcher Aktionsfolgen über Suchen und Planen.

Was sind Nutzenbasierte Agenten?

Der Nutzen ist eine Abbildung der Menge der Zustände in die reellen Zahlen. Die zugeordnete Zahl beschreibt, wie günstig der Zustand für den Agenten ist. Um ein Ziel zu erreichen, kann der Nutzen auf zwei Arten verwendet werden:
  • Wenn es Ziele gibt, die einen Konflikt bilden, läßt sich mit Nutzen Trade-off bestimmen
  • Wenn es mehrere erstrebenswerte Ziele gibt, läßt sich mit Hilfe des Nutzens die Wahrscheinlichkeit des Erreichens eines Ziels gegen seine Wichtigkeit abwiegen
Ein Nutzenbasierter Agent muss auch Zielbasiert sein, da laut Definition dieser mehrere Ziele hat und zwischen den verschiedenen Ebenen wechseln kann.

Welche Eigenschaften definieren Umgebungen?

  • Zugänglich - Unzugänglich

    Eine Umgebung ist zugänglich, wenn der Agent über seine Sensoren alle Informationen aus der Umwelt erfahren kann, die für die korrekte Ausführung seiner Aktionen notwendig sind.

  • Deterministisch - indeterministisch

    Eine Umgebung ist deterministisch, wenn der nächste Zustand vollständig durch den aktuellen Zustand und den gewählten Aktionen definiert ist.

  • Episodisch - nicht episodisch

    Eine Umgebung ist episodisch, wenn sich die Erfahrungen des Agenten in unabhängige Episoden aufteilen lassen.

  • Statisch - dynamisch

    Eine Umgebung ist dynamisch, wenn sie sich ändern kann, während der Agent noch am "denken" ist. Semidynamisch bedeutet nur, dass die Ausführungszeit der Aktionen beschränkt ist.

  • Diskret - kontinuierlich

    Eine Umgebung heißt diskret, wenn es in ihr eine begrenzte und unterscheidbare Anzahl von Wahrnehmungen und Aktionen gibt.

Was sind Umgebungsprogramme?

Sie stellen eine Simulationsumgebung dar, mit der Agentenprogramme getestet werden können. Der Simulator nimmt einen oder mehrere Agenten als Eingabe und stellt den Agenten die richtigen Wahrnehmungen zur Verfügung. Der Simulator nimmt die Aktionen des Agenten entgegen und aktualisiert gegebenenfalls die Umgebung. Eine Umgebung ist bestimmt durch ihren Anfangszustand und ihre Update-Funktion.

Problemformulierung und Problemtypen

Was sind Problemlösende Agenten?

Die Zielformulierung, ausgehend von der aktuellen Situation, ist der erste Schritt beim Problemlösen. Ein Ziel wird als eine Menge von Weltzuständen betrachtet, in denen das Ziel erfüllt ist. Aktionen werden als Übergänge zwischen Weltzuständen betrachtet. Bei der Problemformulierung wird entschieden, welche Aktionen und welche Zustände betrachtet werden sollen. Sie folgt nach der Zielformulierung. Hat ein Agent mehrere mögliche Aktionen mit unbekannten Ausgang, kann er eine Entscheidung herbeiführen, indem er verschiedene mögliche Aktionsfolgen, die zu dem gewünschten Zustand führen, untersucht und die Optimale heraussucht
  • Dieser Vorgang heißt Suche
  • Problembeschreibung als Eingabe und Aktionsfolge als Ausgabe
  • Die Lösung kann dann in der Ausführungsphase ausgeführt werden

Was gehört zur Problemformulierung?

Um ein Problem formulieren zu können, müssen Zustände bekannt und Aktionen definiert werden. Dafür gibt es verschiedene Problemtypen.

Welche Problemtypen gibt es?

  • Ein-Zustands-Probem
  • Mehr-Zustands-Probem
  • Kontingenz-Problem
  • Explorations-Problem

Was ist ein Ein-Zustands-Probem?

Der Agent weiß, in welchem Zustand er sich befindet (d.h. die Umgebung zugänglich) und was jede Aktion bewirkt. So kann er ausgehend von seinem Zustand, für eine Aktionsfolge vorausberechnen, in welchem Zustand er sich nach der Ausführung der Aktionen befinden wird.

Was wird zur Definition eines Ein-Zustand-Problems benötigt?

  • Ein Anfangszustand
  • Eine Menge möglicher Aktionen
  • Ein Zielprädikat
  • Eine Pfadkostenfunktion

Was ist ein Mehr-Zustands-Probem?

Der Agent weiß >nicht, in welchem Zustand er sich befindet (Umgebung unzugänglich), aber er weiß was jede Aktion bewirkt. Dann kann er trotzdem das Erreichen eines Zielzustandes vorausberechnen. Dazu muß er aber über eine Menge von Zuständen schlußfolgern und nicht nur über Einen.

Was ist ein Kontingenz-Problem?

Der Agent kann nicht im voraus eine bestimmte Aktionsfolge berechnen, die zu einem Zielzustand führt. Er benötigt während der Ausführung von Aktionen Sensorinformationen, um zu entscheiden, welche der Aktionen zum Ziel führt.
Statt einer Folge von Aktionen braucht er also einen Baum, in dem jeder Zweig von der Wurzel zu einem Blatt eine Aktionsfolge darstellt. Jede Aktionsfolge behandelt ein kontingentes Ereignis.

Was ist ein Explorations-Problem

Der Agent kennt die Auswirkungen seiner Aktionen nicht. Deshalb muß er experimentieren, um herauszufinden, was die Aktionen bewirken und welche Art von Zuständen es gibt. Dies kann er nur in der realen Welt tun. Dabei kann er aber lernen, d.h. eine interne Repräsentation der Welt aufbauen und zur Entscheidungsfindung nutzen. Eine Umgebung für so ein Problem zeichnet sich durch eine dynamische Umwelt aus. Desweiteren müssen die Aktionen Freiheitsgrade besitzen, um so näher an die reale Umwelt heranzureichen.


Kennt der Agent seinen Anfangszustand nicht oder hat dieser mehr als einen Zustand, kann es kein Einzustandsproblem sein. Benötigt der Agent Sensorinformationen, um schrittweise zu einem Ziel zu gelangen, kann es auch kein Mehrzustandsproblem sein.
Somit bleiben Kontigenz- und Explorationsproblem. Ein Kontignenzproblem besitzt ein festes Repertoire an Funktionen, deren Effekte eindeutig definiert sind. Ein Explorationsproblem zeichnet sich dadurch aus, daß sich der Agent vergangene Schritte merkt, aber sich nicht über die Auswirkungen seiner Aktionen bewußt ist.

Was ist der Anfangszustand?

Der Anfangszustand ist der Zustand, von dem der Agent weiß, dass er sich in Ihm befindet. Eine Aktion wird als Operator oder Nachfolgefunktion bezeichnet, in Verbindung mit dem Zustand, zu dem sie von einem Gegebenen aus führt.

Was gehört zum Zustandsraum?

Der Anfangszustand und die Menge der Aktionen definieren den Zustandsraum. Er besteht aus einer Menge aller Zustände, die vom Anfangszustand aus durch bestimmt Aktionsfolgen, erreichbar sind.

Was ist ein Pfad im Zustandsraum?

Ein Pfad im Zustandsraum ist einfach nur eine Aktionsfolge, die von einem Zustand in einen Anderen führt. Das Zielprädikat kann der Agent auf einen Zustand anwenden, um zu Prüfen, ob e dieser ein Zielzustand ist. Die Pfadkostenfunktion ordnet jedem Pfad im Zustandsraum einen Kostenwert zu. Dieser ist die Summe der Kosten der einzelnen Aktionen entlang eines Pfades.

Was beinhaltet der Datentyp "Problem"?

Der Datentyp Problem ist also definiert durch Anfangszustand, Operatoren, Zielprädikat und Pfadkostenfunktion. Instanzen dieses Datentyps bilden die Eingaben für Suchalgorithmen. Die Ausgabe einer Suche ist dann eine Lösung, d.h. ein Pfad von einem Ausgangszustand in einen Zustand, welcher das Zielprädikat erfüllt.

Wie sind Zustände im Mehrzustandsproblem definiert?

Beim Mehrzustandsproblem werden Zustände durch Zustandsmengen und Aktionen durch Operatormengen ersetzt, welche die Folgezustandsmenge spezifizieren. Ein Operator wird auf eine Zustandsmenge angewandt, indem er auf jeden einzelnen Zustand angewendet wird und die Ergebnisse vereinigt werden. Anstelle des Ergebnisraumes erhält man somit einen Ergebnismengenraum.

Aus welchen Merkmalen wird die Performance einer Problemlösung angegeben?

  • Wird eine Lösung gefunden?
  • Wie hoch sind die Pfadkosten?
  • Wie hoch sind die Suchkosten?
  • Die Gesamtkosten sind die Summe aus Pfad- und Suchkosten.

Welche Typen gehören zum Beispielproblem des "8-Puzzle"?

Zustände

Beschreibung der Plazierung aller acht Plättchen sowie der Leerstelle.

Operatoren

Bewegung der Leerstelle nach links, rechts, oben oder unten.

Zielprädikat

Zustand mit gewünschter Plazierung der Plättchen.

Pfadkosten

Jeder Schritt hat Kosten von 1. Die Kosten eines Pfades sind somit gleich der Pfadlänge.
Intelligente Agenten
Lösen durch Suchen
Schlußfolgern
Logik 1. Ordnung
Planen
Handeln
Beobachten
Neuronale Netze
Quelle: Die Ausarbeitung basiert auf dem Skript von Prof. Dr. Werner Dilger
PDF download:
Kleine ÜbersichtMerkblatt
KI EinführungZusammenfassung
Die wichtigsten StichwörterStichwörter
Logik als GrammatikGrammatiken
Alle Regeln im ÜberlblickInferenzen