Sep, 2023

用分层潜在技能提升自主驾驶的离线强化学习

TL;DR通过设计变分自编码器来学习技能,我们提出了一个基于技能的框架来增强离线强化学习,从而克服车辆规划中的长期规划挑战。通过将学到的技能作为动作,可以训练出能够进行长期推理和规划未来的最终策略,从而在 CARLA 上取得了强大的性能优势。