Various methods to construct saliency maps are evaluated quantitatively with regards to their correctness. This is done in a reinforcement learning setting with DQN and Atari Breakout. The considered saliency map methods include multiple …
Ziel dieser Arbeit ist die Lösung eines Sparse-Reward-Problems, mithilfe von Reward-Shaping und Curriculum-Learning, in einem Adversarial Game-Environment. Dazu wurde in Unity 3D ein 1 vs. 1 Shooter-Environment im Stil von Laser-Tag aufgebaut, in dem …
This project report describes the integration of reinforcement learning into a game development scenario by creating a competitive volleyball game using the Unity ML-Agents Toolkit. The work elaborates on what reinforcement learning is, brings forth …
The Reinforcement Learning algorithm Double Deep Q-Network (DDQN) is known to have an unstable training process (Halat and Ebadzadeh, 2021). In order to overcome instability, this paper aims to deepen the understanding of stability and measuring it. …
Eine der beliebtesten Herausforderungen der letzten Jahre auf dem Gebiet der künstlichen Intelligenz ist die Entwicklung von Agenten, die in der Lage sind, das Spielen von klassischen Videospielen zu perfektionieren. Diese Arbeit diskutiert den …
Verglichen werden die drei Reinforment Lernening Verfahren Cross-Entropy-Method, REINFORCE und Advantage Actor Critic. Für die beiden Environments CartPole und Breakout sollen Policys erlernt werden und an Hand der Returns dieser Policys werden die …
Reinforcement learning (RL) is an area of machine learning concerned with how intelligent agents ought to take actions in an environment in order to maximize the notion of cumulative reward. The purpose of reinforcement learning is for the agent to …
Im Multiagent Reinforcement Learning (MARL) wird eine effektive Integration von Methoden des Reinforcement Learning (RL) und Multiagentensystemen (MAS) angestrebt. Mithilfe einer Menge adaptiver und lernender Agenten in einem verteilten intelligenten …
Deep Deterministic Policy Gradient (DDPG) ist eine Methodik zur Kontrolle kontinuierlicher Simulationsumgebungen des Reinforcement Learnings. Im Folgenden wird evaluiert inwiefern DDPG für die physikalische HalfCheetah-Umgebung mittels …
End-to-End gesteuerte autonome Fahrzeuge durch Reinforcement Learning bieten im Vergleich zu End-to-End Ans ̈atzen durch su- pervised learning einen Vorteil. Beim Reinforcement Learning macht das Fahrzeug eigene Erfahrungen und wertet diese anhand …