通过组合泛化实现机器人操作的高效数据收集
从异构数据中训练通用机器人策略,使用 Policy Composition 方法将不同模态和领域的数据结合起来,学习场景级和任务级的广义操作技能,实现对多任务操作的灵活综合和推理时策略行为的自适应。在模拟和真实世界实验中,该组合策略在不同场景和任务下实现了稳健和灵巧的性能,并优于单个数据源的基线结果。
Feb, 2024
该研究提出了一种基于任务实体组成结构的框架和适当的策略设计,旨在解决通过目标配置来规范控制、机器人和规划的任务,此策略运用 Deep Sets 和 Self Attention 等结构,在模拟机器人操作任务的训练中,成功率更高且泛化能力更强。
Mar, 2022
本研究提供了四个来自 CompoSuite 的离线强化学习数据集,用于解决机器人操作的组合任务,评估表明组合方法比非组合方法优越,但当前方法仍无法提取任务的组合结构以推广到看不见的任务,需要进一步研究。
Jul, 2023
研究表明,大多数基于数据驱动的机器人任务都是在实验室环境中收集的大规模数据集上进行训练的,该论文提出了在人们的家庭环境中使用低成本机器人手动搬运收集数据的方法,并开发了一种框架来处理数据中的噪音标签。该模型在采集了 28,000 次抓取数据并针对不同环境条件进行物理性能测试后,相较于实验室收集的数据,展现了明显的 43.7% 的改善,该模型还比其他模型表现 10% 更好。
Jul, 2018
模仿学习中泛化难题的困难源自于视觉机器人操作中的因素变化,作者研究了模拟仿真和实际机器人任务中不同因素的泛化难度,并设计了一个新的基准测试用来评估泛化效果。
Jul, 2023
我们提出了一个原始级别的机器人数据集 RH20T-P,其中包含约 33000 个视频剪辑,涵盖了 44 个多样且复杂的机器人任务,为模块化泛化代理的未来发展提供了便利。
Mar, 2024
通过基于自由能原理的预测编码和主动推理框架,将视觉、本体感知和语言集成到一个受脑启发的神经网络模型中,通过多种模拟实验及机械臂的测试,研究表明,在增加任务组合的变异性时,对于学习未知的动词 - 名词组合的泛化能力得到了显著提升,这归因于语言潜在状态空间中的自组织组合结构被感觉运动学习显著影响,视觉注意和工作记忆对于准确生成视动序列以实现语言表示目标具有重要作用,这些结果推进了我们对通过语言和感觉运动经验相互作用发展组合性机制的理解。
Mar, 2024
提出了一种基于模型的强化学习策略,通过训练可转移机器人感知的世界动力学模型和机器人特定的动力学模型,从而利用以前在其他机器人上收集的数据来减少对机器人特定数据的需求,并在模拟和实际机器人上实现了视觉控制任务上的零泛化
Jul, 2021
通过重新使用大型数据集,提出在多个机器人平台上训练单一策略的关键设计决策,通过对视觉和动作空间的对齐以及对内部表示的对齐来解决机器人平台之间的领域差异,验证了该方法在不同机器人上收集的新任务数据中成功率和样本效率的显著提升。
Jul, 2023
本篇论文从识别可表达性学习出发,将组合性视为数据生成过程的属性而非数据本身,并提出了仅取决于训练分布和模型架构的轻微条件,为组合泛化建立了理论框架,并验证了其应用于现实世界场景的结论,从而为组合泛化的原则性理论研究铺平了道路。
Jul, 2023