Oct, 2023

通过 Stein 变分梯度下降的可微分任务与动作规划

TL;DR我们提出了一种名为 Stein Task and Motion Planning (STAMP) 的新算法,利用并行化和可微分仿真来高效地搜索多个不同的计划。STAMP 将离散和连续的任务和动作规划问题转化为能够使用变分推断求解的连续优化问题。我们的算法基于 Stein 变分梯度下降算法和在 GPU 上并行化的可微分物理模拟器,以高效地获得推断的梯度。此外,我们采用模仿学习引入动作抽象,将推断问题降维。我们通过两个任务和动作规划问题演示了我们的方法,并实证表明 STAMP 能够:1)并行产生多个不同的计划;2)比现有 TAMP 基准更有效地搜索计划。