Mar, 2019

应用多智能体对抗性强化学习创建基于规则代理的故障场景制造器及其在自主驾驶中的应用

TL;DR研究了在多智能体环境中,为包括基于规则的代理在内的回报学习问题。提出了一种通过训练对抗智能体来有效地发现失败场景的方法,并通过简单环境和自动驾驶模拟器展示了该方法的有效性。