Feb, 2023

DiSProD: 可微分的分布符号传播规划方法

TL;DR该论文介绍了 DiSProD,它是一种为具有连续状态和动作空间中的概率转移的环境开发的在线规划器,该规划器建立符号图,捕获未来轨迹的分布,该分布已给定策略,并使用独立性假设和分布的近似传播。该方法在处理随机环境、搜索深度敏感性、奖励稀疏性和大动作空间方面均优于现有规划器,并在地面车辆和船只上的实验中得到验证。