May, 2024

一致性策略:通过一致性蒸馏加速视觉动作策略

TL;DR通过一项快速推断的Consistency Policy方法,本研究提出了一种在资源受限的机器人系统中实现低延迟决策的有效替代Diffusion Policy的学习视觉动作控制方法。通过在已训练的Diffusion Policy中强制实施自我一致性,从而获得Consistency Policy,并在六个仿真任务和两个真实世界任务上与Diffusion Policy和其他相关加速方法进行比较,结果显示Consistency Policy相比其他方法可以提高一个数量级的推断速度并保持竞争性的成功率。