May, 2019

基于注意力机制的深度强化学习在多视角环境中的应用

TL;DR研究了多视角环境下的深度强化学习问题,并提出基于注意力机制的方法以学习动态关注环境中不同视角的重要性以促进决策制定和复杂策略的学习。在 TORCS 赛车模拟器和三个其他带有障碍物的复杂 3D 环境上验证了该方法的有效性。