少样本模仿学习任务嵌入控制网络
本研究提出一种元模仿学习方法,通过深度神经网络对机器人进行高效学习,使机器人能够从一个单独的示例中获取新技能,并能够终端到端地学习。实验结果表明,该方法能够扩展到原始像素输入,并且需要较少前置任务数据,具有广泛的应用前景。
Sep, 2017
本文旨在通过模仿学习的角度研究如何通过扩大数据采集并建立交互灵活的学习系统来促进基于视觉的机器人操作系统向新任务的泛化,当扩展真实机器人的数据采集到 100 个不同的任务时,我们发现此系统可以实现 24 个未见过的操作任务,平均成功率为 44%。
Feb, 2022
我们提出了一种自我监督任务推理方法,通过观察到的未标记演示的运动和效果部分的自组织以及联合动作 - 意图嵌入的自组织学习,学习行动和意图嵌入,并构建了一个行为匹配的自我监督学习目标来训练一个新型的任务推理网络,该网络将未标记演示映射到其最近的行为嵌入作为任务表示,所建立的多任务策略通过强化学习进行训练,以优化任务的性能。我们的方法在固定集合和持续多任务学习设置下使用一个人形机器人进行评估,并与不同的多任务学习基线进行比较。结果表明,我们的方法在持续学习设置下性能优于其他基线,尤其在具有挑战性的情况下,并且能够从不完整的演示中推断出任务。在单次任务泛化实验中,我们的方法还显示出对未见任务的推理能力。
Sep, 2023
本研究探讨了完全自我监督的学习方法,基于状态达成最短时间来实现通用图像嵌入和控制基元,同时介绍了一种新的状态操作价值函数结构,建立了模型自由和模型基础方法之间的联系,并提高了学习算法的性能。三项模拟机器人任务的实验结果表明了这些发现。
Jan, 2019
提出了一种多任务学习的层级强化学习框架,名为 SGIM-SAHT,用于使机器人完成各种复杂的控制任务,并演示了该框架能够学习到基本的任务和复合任务之间的层次关系,从而实现了从简到难的任务学习,并通过表示任务依赖性、内在动机探索、主动模仿等途径,使机器人能够推断出自己的任务学习进度,并决定何时、如何、以及向谁进行模仿学习。
Feb, 2022
本文介绍了一种使用神经网络和 Transformer 注意机制的方法,通过向机器人展示上下文视频来缩小机器人学习中的领域差距,并实现了对单次操作任务的 2 倍成功率提升。
Nov, 2020
介绍了一种新的元控网络方法,它采用了任务不可知的元学习技术和新的层冻结设计,大大缩短了学习步骤,并在边缘任务中实现了零 - shot 适应性,在更复杂的非边缘任务中,如人体姿势,仅需 100 个微调步骤就能实现控制,优于现有方法。
Dec, 2023
本研究提出了一种 meta-RL 方法,通过捕捉不同任务之间的共享信息和快速抽象任务特定信息的能力,使用任务编码器生成任务嵌入并在所有任务之间共享策略,实现在训练和新任务上的更好学习能力和更高回报率。
May, 2019
以多任务学习为基础,提出一种通过演示学习从而训练低成本机械臂控制器,以便完成数个拾取放置任务及非预抓取式操控操作的技术,使用原始图像作为输入并生成机器人臂路径的基于循环神经网络的控制器,参数在任务之间共享;同时结合基于 VAE-GAN 重建以及自回归多模态行为预测的控制器模型。结果表明,可以通过行为克隆直接从原始图像中学习复杂的操纵任务,例如拾起毛巾、擦拭物体并将毛巾放回原位等,权重共享和基于重构的正则化大大提高了泛化性和鲁棒性,同时同时训练多个任务能够增加所有任务的成功率。
Jul, 2017