May, 2023

自主驾驶车辆的协作 RL 测试基于潜能的信用分配

TL;DR本文介绍了协作强化学习的概念,用于为自主车辆规划和决策模块生成具有挑战性的测试用例,提出了一种基于潜在因素的奖励塑形方法,旨在解决交通场景中多个实体相互作用时的贡献分配问题,并在模拟环境中进行了实验验证。