Oct, 2024

扩散变换器策略

TL;DR本研究解决了现有视觉-语言动作模型在处理多样化动作空间时的能力不足问题,通过引入一种名为扩散变换器策略的大型多模态变换器模型,直接对动作段进行去噪。结果表明,该方法在各种机器人数据集上实现了更优的泛化性能,尤其在实际应用中如Franka臂上表现突出,显著提升了任务完成率。