Reward-Shaping und Curriculum-Learning in einem Sparse-Reward-Adversarial-Environment in Unity3D

Abstract

Ziel dieser Arbeit ist die Lösung eines Sparse-Reward-Problems, mithilfe von Reward-Shaping und Curriculum-Learning, in einem Adversarial Game-Environment. Dazu wurde in Unity 3D ein 1 vs. 1 Shooter-Environment im Stil von Laser-Tag aufgebaut, in dem eine nicht-triviale Aufgabe gelöst werden muss, um einen Reward zu erhalten. Sowohl das Sparse-Reward-Problem als auch die beiden Lösungsverfahren werden in der Theorie beschrieben und dann mithilfe des Environments in der Praxis dargestellt. Anschließend folgt eine Bewertung und Gegenüberstellung der beiden Verfahren.