EquiBot: 适应SIM(3)-等变扩散策略的通用且高效学习
本文利用李群的表示理论构建了新的 SE(3) - 等变能量模型,允许高样本的端到端学习。我们证明这些模型可以从头开始学习,但具有很高的样本效率,并且可以推广到具有不同要求的任务中。
Jun, 2022
本文介绍了Diffusion-EDFs,一种新颖的方法,将SE(3)-等变性(roto-translation equivariance)引入扩散生成模型中,展示出了卓越的数据效率,只需要5至10个任务演示进行有效的端到端训练,并且相比以前的基于扩散的操作方法,具有更好的泛化能力。
Sep, 2023
利用等变结构和数据增强技术,通过训练简单任务模型以实现物体的平移、旋转、缩放等变换,并直接将其迁移到不同尺寸、位置和方向的物体上,从而实现机器人在可变形和关节物体的操作任务中的泛化。
Oct, 2023
我们通过对专家演示进行政策学习来解决没有奖励函数的问题,并提出了将模仿学习视为微调问题的方法,通过在高维原始像素观测中在Franka Kitchen环境上取得了最新的最佳性能,只需要10个演示且没有奖励标签,同时解决了复杂的灵巧操作任务。
May, 2024
本文的研究重点是在具有不同形态的机器人操纵器之间传递控制策略。通过将源机器人和目标机器人的状态和动作空间投影到一个共同的潜在空间来实现跨机器人的策略转移。我们使用编码器、解码器和潜在空间控制策略同时进行训练,利用任务表现、潜在动力学一致性和编码器-解码器能力来重构原始状态和动作。为了转移学得的控制策略,我们只需要训练目标编码器和解码器来将新的目标领域对齐到潜在空间。我们使用生成对抗训练,通过循环一致性和潜在动力学损失,在目标领域中无需访问任务奖励或奖励调整,展示了模拟环境到真实环境以及不同状态、动作和形态的机器人之间的策略转移。
Jun, 2024
本研究解决了机器人学习中数据集小且多样性不足的问题,提出了CrossFormer,一种基于变换器的灵活政策,能够处理任意体形的数据。通过在全球最大和最丰富的数据集上训练,结果表明该模型能够有效控制各种机器人,且性能优于专门针对特定体形的政策,为跨体学习开辟了更广阔的前景。
Aug, 2024
本研究解决了模仿学习在机器人领域中应用成本高昂的问题,提出了一种低成本、易于复制和适应不同机器人及环境的学习框架。通过展示在工业机器人上成功应用该框架,研究表明即使使用简单的网络结构和较少的演示,亦可实现多任务机器人学习。此外,本研究还提出了投票正率(VPR)这一新评价策略,以提供对真实操作任务更客观的性能评估。
Sep, 2024
本研究解决了现有扩散政策在性能与行动时间范围之间的权衡问题,提出了一种新颖的潜在权重扩散方法(LWD),通过在潜在空间中学习策略分布,以生成更小的策略网络并减少推理查询。实验表明,在Metaworld MT10基准上,LWD在实现更高成功率的同时,推理模型规模可减少约18倍,且在较长行动时间范围内表现优于传统扩散政策。
Oct, 2024
本研究解决了模仿学习中对广泛示例依赖的问题,提出ET-SEED这一高效轨迹级SE(3)等变扩散模型,以生成复杂机器人操作任务中的动作序列。通过理论扩展等变马尔可夫核并简化等变扩散过程的条件,显著提高了策略的训练效率,并在多种机器人操作任务中表现出优越的数据效率和操作能力。
Nov, 2024