XSkill:跨体现技能发现
该研究旨在通过自我监督的方法,使用跨代理之间的演示视频来自动发现和学习视觉奖励函数,以训练在不同体型和动作的情况下进行任务的智能体。研究结果表明,这种方法不仅提高了效率,还具有良好的泛化性能。
Jun, 2021
通过模仿学习,我们能够快速理解一个新任务,通过演示,我们可以直接获得哪些动作需要执行以及它们的目标的知识。本文介绍了一种新的模仿学习方法,解决了机器人模仿人类所面临的视角变化和身体模式等挑战。我们的方法可以利用单个人类演示来抽象展示任务的信息,并利用该信息进行泛化和复制。我们通过两种最先进的方法进行了新的集成:扩散式动作分割模型用于抽象演示的时间信息,以及开放词汇对象检测器用于空间信息。此外,我们通过符号推理来改进抽象的信息,并利用逆向运动学创建行动计划,以使机器人能够模仿演示的动作。
Jan, 2024
本研究提出了一种使用元学习技术从人类视频中进行一次学习的方法,使机器人能够学习从人类示范中执行任务,无需对人类动作进行特定设计,并且在多种任务上演示了机器人实现的能力。
Feb, 2018
本文提出了一种基于大规模数据驱动的框架,通过对动作片段的不需要任务特定的注释或分割的大数据集进行对抗性模仿学习和无监督强化学习来开发可生动表现行为且易于控制下游任务的技能嵌入,并且利用大规模并行 GPU 模拟器的并行计算能力,训练技能嵌入,使其能够学习丰富、多样化的技能,从而使在新的多种任务中表现成功,为物理模拟动画的基础控制策略提供了新思路。
May, 2022
通过大型语言模型,我们研究了在具有高度泛化能力的视觉行为克隆代理中,从视觉观察中进行复杂多模态机器人操作任务。我们提出了 NBCagent,一个语言条件下的持续学习行为克隆代理,在面对一系列具有挑战性的未知任务时,可以不断学习新的机器人操作技能的观察知识。我们设计了一个特定于技能的进化规划器来进行知识解耦,可以将新的技能特定知识不断嵌入到我们的 NBCagent 代理中。同时,我们还提出了一个技能共享的语义渲染模块和技能共享的表示蒸馏模块,有效地在语义和表示方面传递抗遗忘的技能共享知识,进一步解决了旧技能的灾难性遗忘问题。最后,我们设计了一个持续的机器人操作基准,并进行了一些昂贵的实验,证明了我们方法的显著性能。
Mar, 2024
我们提出了一种方法,通过仅利用许多不同设置的少量实际交互轨迹,使机器人能够有效地学习操纵技能,并由此建立了一个基于人的视频的结构化行为空间,从而使不同的机器人能够在复杂环境下学习各种操纵技能。
Aug, 2023
本研究提出了一种基于商用机械臂的可行的、简化了数据收集过程的、能够有效采集各种复杂场景演示数据的人机互动界面,并采用了多项数据增强技术来优化模型的学习性能,最终在非捏取推动和物品堆叠等任务中获得了较高的成功率。
Aug, 2020
本文的研究重点是在具有不同形态的机器人操纵器之间传递控制策略。通过将源机器人和目标机器人的状态和动作空间投影到一个共同的潜在空间来实现跨机器人的策略转移。我们使用编码器、解码器和潜在空间控制策略同时进行训练,利用任务表现、潜在动力学一致性和编码器 - 解码器能力来重构原始状态和动作。为了转移学得的控制策略,我们只需要训练目标编码器和解码器来将新的目标领域对齐到潜在空间。我们使用生成对抗训练,通过循环一致性和潜在动力学损失,在目标领域中无需访问任务奖励或奖励调整,展示了模拟环境到真实环境以及不同状态、动作和形态的机器人之间的策略转移。
Jun, 2024