ICMLMar, 2020

FormulaZero:通过离线人口合成实现分布式鲁棒在线适应

TL;DR本文针对多智能体环境下自主驾驶车辆行驶安全和效率平衡问题,提出了以自我博弈为基础的对抗生成网络和分布式鲁棒型优化方法,实验结果显示我们的方法能够在自主驾驶赛车中取得较好的性能和鲁棒性。