May, 2024

HOPE: 基于强化学习的混合策略路径规划方法用于多样化停车场景

TL;DR本文介绍了一种新颖的解决方案,Hybrid POlicy Path plannEr (HOPE),它将基于强化学习的智能体与 Reeds-Shepp 曲线集成在一起,在不同的场景中实现有效的路径规划。通过采用变压器作为网络结构来融合环境信息和生成规划路径,并引入了动作掩码机制以提高强化学习训练的效率和效果。实验结果表明,该方法在规定的停车场景中胜过了传统的基于规则和强化学习方法,具有更高的规划成功率和推广性。