Mar, 2024

强化学习用于自动驾驶系统在线测试的复制与扩展研究

TL;DR复制和扩展了前一次经验研究,研究表明引入强化学习与多目标搜索相结合的方式,在深度神经网络系统的在线测试中优于其他技术(随机搜索和多目标搜索)。新的 RL 代理能够收敛到一个有效策略,明显优于随机测试,并且揭示了进一步探索如何充分利用 RL 进行在线 ADS 测试的可能改进方向。