May, 2024

RACER:基于认知风险敏感的强化学习在少发生事故的情况下实现快速驾驶

TL;DR通过将风险敏感控制与自适应动作空间课程相结合,我们提出了一种强化学习框架,能够既学习高性能的策略,又避免过多的失败,在真实世界的越野驾驶任务中具有较少的安全违例,并在具有相似挑战的驾驶和非驾驶仿真环境中导致更高性能的策略。