多批评家技能学习
本文研究了如何使用参数化技能有效地解决现实世界中的稀疏奖励任务,发现通过显式建模任务模式的状态独立性,可以极大地提高无模型强化学习算法的样本效率;同时,这些模式可以被转移用于解决相关任务。实验结果验证了我们的方法在机械手臂操作任务中的有效性。
Sep, 2019
本文介绍了使用基于图形的关系结构从简单的任务中学习并实现复杂的机器人操作任务,使用了强化学习方法并在喂入少量数据的情况下超越现有的最先进方法,同时也实现了零样本泛化。
Dec, 2019
本文提出了一种基于多任务强化学习算法的重置自由学习方法,可用于实现机器人的复杂困难操作,无需人工干预,实验表明该方法可以有效缩放复杂的问题并实现机器人的技能多样化。
Apr, 2021
本文介绍一种基于预定义行为模块的学习框架Manipulation Primitive-Augmented Reinforcement Learning(MAPLE),通过这种学习框架实现机器人在多种实际操作任务中表现出色,MAPLE 具有超越基线方法的性能。
Oct, 2021
ManiSkill2是SAPIEN ManiSkill基准的下一代版本,它包含20个操作任务族,2000多个物体模型和4M多演示帧,定义了一个统一的界面和评估协议,支持各种算法,视觉观察和控制器,并赋予快速视觉输入学习算法的能力。
Feb, 2023
通过结合条件序列建模和技能模块化,我们提出了Skill Transformer方法,用于解决长期规划的机器人任务,并通过Transformer架构和演示轨迹对高级技能和低级动作进行端到端训练,并通过技能预测模块保持整体任务的组合性和模块化,同时考虑低级动作并避免常见的模块化方法中的交接错误。在具有挑战性的重新排列问题中,我们对Skill Transformer进行了测试,发现其在新场景中执行稳健的任务规划和低级控制,并在成功率上比基线提高了2.5倍。
Aug, 2023
我们通过将模仿和强化学习范式相结合,开发了一种学习和适应技能的混合模型,通过学习动态系统的关键点,利用机器人在技能学习过程中的视觉观察,预测场景内的参考点,从而实现机器人在新环境中的零样本泛化能力和在目标环境中更快地优化技能的目标,同时能有效处理场景变化。
Oct, 2023
语言驱动的机器人技能研究中,通过利用大规模语言模型的高级推理能力应用于低级机器人控制,继续面临的挑战是获取多样化的基础技能。本研究介绍了一种完全由语言模型驱动的技能发现框架,通过提供的场景描述和机器人配置生成任务提案,并逐步获得新的技能来完成任务,使用强化学习过程以及独立的视觉-语言模型确保学到的行为的可靠性和可信度,从而使机器人能够高效地提出和完成高级任务。
May, 2024
本研究针对双手灵巧操控这一机器人领域的重要但尚未深入研究的问题,提出了一种新颖的方法,通过丰富的人类示范有效学习多样的双手灵巧技能。研究展示的BiDexHD框架能够在多任务间共享行为,推动了通用双手灵巧操控的进展,其在TACO数据集上的实证评估显示了84.59%的任务完成率,突显了其在零样本迁移能力上的有效性。
Oct, 2024
本研究解决了机器人操作中技能学习的挑战,提出了一种新颖的技能学习方法,通过自动生成大量多样化任务来发现可组合的行为。研究结果表明,所学习的技能能帮助机器人稳健地与环境中的物体互动,并成功应用于未见的操作任务中,具有重要的实际应用潜力。
Oct, 2024