Reward-Shaping und Curriculum-Learning in einem Sparse-Reward-Adversarial-Environment in Unity3D

August 2022

PDF Project

Abstract

Ziel dieser Arbeit ist die Lösung eines Sparse-Reward-Problems, mithilfe von Reward-Shaping und Curriculum-Learning, in einem Adversarial Game-Environment. Dazu wurde in Unity 3D ein 1 vs. 1 Shooter-Environment im Stil von Laser-Tag aufgebaut, in dem eine nicht-triviale Aufgabe gelöst werden muss, um einen Reward zu erhalten. Sowohl das Sparse-Reward-Problem als auch die beiden Lösungsverfahren werden in der Theorie beschrieben und dann mithilfe des Environments in der Praxis dargestellt. Anschließend folgt eine Bewertung und Gegenüberstellung der beiden Verfahren.

Type

Report

reinforcement learning