Jan, 2020

具有潜在深度强化学习的可解释端到端城市自主驾驶

TL;DR该研究提出了一种解决复杂城市场景下的自动驾驶问题的可解释性深度强化学习方法,在学习过程中引入了序贯潜在环境模型,并生成了语义鸟瞰遮罩,以解释学习策略的行为。实验结果显示,该方法在城市场景中的表现优于 DQN、DDPG、TD3 和 SAC 等基线模型。