机器人机械臂设计中的动力学指导扩散模型
学习轨迹分布的先验信息可以帮助加速机器人运动规划优化,本工作提出了学习扩散模型作为先验信息的方法,并通过扩散模型的逆去噪过程在任务目标条件下直接从后验轨迹分布中进行采样,实验证明扩散模型是编码高维机器人运动轨迹分布的强先验。
Aug, 2023
我们提出了EDMP,即基于代价引导的扩散运动规划集合,旨在结合经典规划与基于深度学习的运动规划的优势,通过在多样的有效运动轨迹集合上进行训练的扩散网络,计算特定场景的代价,如“碰撞代价”,并引导扩散生成满足场景约束条件的有效轨迹,同时使用代价集合而非单一代价函数来指导扩散过程,显著提高了成功率,并保留了与经典规划器主要相关的泛化能力。
Sep, 2023
介绍了一种名为Hierarchical Diffusion Policy (HDP)的多任务机器人操作策略,包括分层结构、任务规划、运动轨迹和运动规划中的运动学感知控制。实验证明,HDP在模拟和实际环境中的成功率显著高于现有方法。
Mar, 2024
利用潜在扩散模型进行机器人灵巧可变形物体操控的轨迹优化,通过渐变自由引导采样方法和反扩散过程,发现并优化可行解,显著超越传统的轨迹优化和竞争基准方法。
Mar, 2024
我们提出了一种名为ManiCM的实时机器人操作模型,该模型通过在扩散过程中施加一致性约束来生成机器人动作,以实现仅进行一步推理。通过在机器人动作空间中制定一致的扩散过程和点云输入条件下对原始动作进行直接降噪操作,我们设计了一种一致性蒸馏技术来直接预测动作样本,而不是预测视觉领域中的噪声,以在低维动作流形中实现快速收敛。我们在Adroit和Metaworld的31个机器人操作任务上评估了ManiCM的性能,结果表明我们的方法平均推理速度提高了10倍,同时保持具有竞争力的平均成功率。
Jun, 2024
本研究解决了双手操作中机器人手臂协调的复杂性以及训练数据不足的问题。提出了机器人扩散变换器(RDT),这是一个创新的扩散基础模型,能够有效表示多模态,并创建了统一的物理可解释动作空间以解决数据稀缺。实验表明,RDT在各种复杂任务中表现显著优于现有方法,具备零-shot泛化能力,能够理解语言指令,且仅需少量示例学习新技能。
Oct, 2024
本研究解决了现有扩散政策在性能与行动时间范围之间的权衡问题,提出了一种新颖的潜在权重扩散方法(LWD),通过在潜在空间中学习策略分布,以生成更小的策略网络并减少推理查询。实验表明,在Metaworld MT10基准上,LWD在实现更高成功率的同时,推理模型规模可减少约18倍,且在较长行动时间范围内表现优于传统扩散政策。
Oct, 2024
本研究针对机器人在接触密集和动态环境中缺乏人类灵活性的问题,提出了一种名为DIPCOM的扩散策略框架,用于顺应控制任务。通过多模态分布建模和生成扩散模型,该方法有效提高了机器人在任务中的力控制能力,并在真实任务中验证了其有效性。
Oct, 2024
本研究解决了模仿学习中对广泛示例依赖的问题,提出ET-SEED这一高效轨迹级SE(3)等变扩散模型,以生成复杂机器人操作任务中的动作序列。通过理论扩展等变马尔可夫核并简化等变扩散过程的条件,显著提高了策略的训练效率,并在多种机器人操作任务中表现出优越的数据效率和操作能力。
Nov, 2024