通过抓取学习推动:利用多项任务进行有效学习
以多任务学习为基础,提出一种通过演示学习从而训练低成本机械臂控制器,以便完成数个拾取放置任务及非预抓取式操控操作的技术,使用原始图像作为输入并生成机器人臂路径的基于循环神经网络的控制器,参数在任务之间共享;同时结合基于 VAE-GAN 重建以及自回归多模态行为预测的控制器模型。结果表明,可以通过行为克隆直接从原始图像中学习复杂的操纵任务,例如拾起毛巾、擦拭物体并将毛巾放回原位等,权重共享和基于重构的正则化大大提高了泛化性和鲁棒性,同时同时训练多个任务能够增加所有任务的成功率。
Jul, 2017
通过无模型深度强化学习,可以从头开始发现和学习机器人操作中的推动和抓取之间的复杂协同作用,并在具有挑战性的混乱情况下提高抓取成功率和拾取效率并实现泛化。
Mar, 2018
本文提出了使用端到端的控制方法和领域随机化训练卷积神经网络,实现机器人对多阶段任务的执行。结果表明,此方法在真实环境中能够成功执行任务并推广到新环境。
Jul, 2017
本文提出了一种高样本效率的目标导向层次强化学习模型,使用推和抓策略来实现在混乱环境下抓取指定目标物体,经过一系列实验验证表明,该模型表现出了高的任务完成率和目标抓取成功率,并能够适应目标不明确的条件,并且可以直接转移到实际应用中。
Mar, 2021
通过开发多模态、多任务、视觉 - 语言 - 行为模型,本文提出一条路径,以增加机器人辅助手术中机器人的自治性,最终我们认为,机器人辅助手术能够从通用模型中获益,并提供三个指导性行动以增加机器人辅助手术的自治性。
Jan, 2024
提出了一种多任务学习的层级强化学习框架,名为 SGIM-SAHT,用于使机器人完成各种复杂的控制任务,并演示了该框架能够学习到基本的任务和复合任务之间的层次关系,从而实现了从简到难的任务学习,并通过表示任务依赖性、内在动机探索、主动模仿等途径,使机器人能够推断出自己的任务学习进度,并决定何时、如何、以及向谁进行模仿学习。
Feb, 2022
本文提出 RoboNet,一个用于共享机器人经验的开放数据库,结合视觉先见性和监督逆模型两种学习算法,用于视觉引导的机器人操作的泛化模型学习,其预训练和微调性能超过使用 4 倍至 20 倍更多数据的机器人特定培训方法。
Oct, 2019
本文旨在探索在机器人技能学习中实现实用的数据重用,通过使用包含多个任务和多个领域的多样化数据集进行训练,研究表明这种方法可以大大提高机器人在未曾见过的领域和任务中的成功率,大大降低了对采集昂贵的新数据集的需求。
Sep, 2021