Sprungmarken

Servicenavigation

Hauptnavigation

Sie sind hier:

Hauptinhalt

PG 578: HeISs - Hierarchische Inferenz evolvierender Spielstrategien

Aktive und passive Lernstrategien

Informationen

Zusammenfassung des Themas

Sowohl bei traditionellen Strategie-Brettspielen wie Go oder Schach als auch bei modernen Strategie-Computerspielen wie Civilization oder StarCraft ist das "Durchschauen" des Gegners wesentlicher Bestandteil erfolgreicher Spielstrategien. Bei ansonsten weitgehend ebenbürtigen Gegnern, seien es Computer oder Menschen, gibt die Kenntnis gegnerischer Stärken und Schwächen typischerweise den Ausschlag. Tatsächlich kann dieser Faktor sogar die "objektiv" größere Stärke eines Gegner kompensieren.

Bei Computerspielen kommt oft erschwerend hinzu, dass die genauen Spielregeln oder Gesetze im Laufe des Spiels erst noch ermittelt werden mussen. Man denke z.B. an die implementierte Physik, die konkrete Berechnung von Schäden, Fahr- oder Flugbahnen, Bremswegen, usw. Erst wenn man diese Gesetzmäßigkeiten verstanden hat, kann man optimal agieren.

In der Projektgruppe wurden zwei klassische Verfahren – aktives und passives Automatenlernen – zur Ermittlung gegnerischer Strategien bzw. der konkreten Spielregeln eingesetzt, evaluiert, verglichen und insbesondere kombiniert und optimiert.


Arbeit der Projektgruppe

Die Projektgruppe erreichte dieses Ziel in mehreren Schritten, in denen mehrere wiederverwertbare Komponenten auf Basis austauschbarer Algorithmen realisiert wurden:

  1. Ein Framework, welches eine generische Schnittstelle zur Interaktion mit Spielen bereitstellt und erlaubt, die darauf aufbauenden Techniken auf beinahe beliebige Spiele anzuwenden.
  2. Eine passives Lernsystem auf Basis der AutomataLib, welches durch Analyse von Spielprotokollen die Regeln des Spiels und die Stategie eines Gegners erlernen kann.
  3. Ein aktives Lernsystem auf Basis der LearnLib, welches während der eigenständigen Interaktion mit Spiel und Gegner Regeln und Strategie inferiert.
  4. Ein Inferenzsystem, welches auf Basis des gelernten Wissens eine gegnerische Strategie erkennen und eine Gegenstrategie entwickeln kann

Diese Komponenten wurden anhand der Spiele Vier Gewinnt und Chain Reaction und diverser KIs für diese Spiele ausgiebig evaluiert.

In der Projektgruppe wurden erfolgreich Technologien entwickelt, die die Komplexität bein Anwenden von Lernverfahren deutlich reduzieren. Die Wiederverwendbarkeit und Skalierbarkeit der Komponenten wurde dabei durch eine gezielte Trennung sichergestellt. Des Weiteren wurden diverse Erkenntnisse über die Arbeit von Lernalgorithmen gewonnen.

Materialien


Endbericht

Der Endbericht der Projektgruppe ist bei Eldorado verfügbar. 

Nebeninhalt

Kontakt

Prof. Dr. Bernhard Steffen
Lehrstuhlinhaber