Mar, 2024

CtRL-Sim: 反应性和可控驾驶代理的离线强化学习

TL;DR在这项研究中,我们提出了一种名为CtRL-Sim的方法,它利用退化条件离线强化学习和物理增强的Nocturne模拟器,通过处理真实世界的驾驶数据来有效生成具有反应性和可控性的交通代理。我们展示了CtRL-Sim能够高效生成多样且逼真的安全关键场景,并提供对代理行为的精细控制。此外,我们还表明,通过用模型生成的模拟安全关键场景对模型进行微调可以增强这种可控性。