May, 2024

一致性策略:通过一致性蒸馏加速视觉动作策略

TL;DR通过一项快速推断的 Consistency Policy 方法,本研究提出了一种在资源受限的机器人系统中实现低延迟决策的有效替代 Diffusion Policy 的学习视觉动作控制方法。通过在已训练的 Diffusion Policy 中强制实施自我一致性,从而获得 Consistency Policy,并在六个仿真任务和两个真实世界任务上与 Diffusion Policy 和其他相关加速方法进行比较,结果显示 Consistency Policy 相比其他方法可以提高一个数量级的推断速度并保持竞争性的成功率。