使用行为原始模块在数据效率模仿学习中支持脚手架操纵任务
本文介绍一种基于预定义行为模块的学习框架 Manipulation Primitive-Augmented Reinforcement Learning(MAPLE),通过这种学习框架实现机器人在多种实际操作任务中表现出色,MAPLE 具有超越基线方法的性能。
Oct, 2021
我们研究了从单个人类表演视频中学习多阶段基于视觉的任务,同时利用不同对象的子任务演示数据,学习如何从原始像素中学习基本行为并动态组合这些行为以执行多阶段任务的方法。
Oct, 2018
本研究提出了一种基于商用机械臂的可行的、简化了数据收集过程的、能够有效采集各种复杂场景演示数据的人机互动界面,并采用了多项数据增强技术来优化模型的学习性能,最终在非捏取推动和物品堆叠等任务中获得了较高的成功率。
Aug, 2020
该研究旨在通过学习使用感知运动基元来解决复杂的长期规划操作问题,其需要将基本技能组合成新的技能来推广应用于广泛的问题中,同时使用高效的主动学习和采样方法,将学习和规划方法结合来规划各种复杂的动态操作任务。
Jun, 2020
提出了一种新的基于模仿学习的框架(DIME),借助单个 RGB 相机观察人类运营,并在多指控制策略上进行了培训,以解决机械手复杂操纵任务的挑战。
Mar, 2022
本文提出了一种在小规模人类示范预算下改善模仿学习性能的流程,并将其应用于需要高精度和长视程操作的装配任务,通过结合表达能力强的策略架构和数据集扩展与基于仿真的数据增强等技术来扩展数据集支持并在高精度要求的瓶颈区域附近监督模型的局部纠正动作,实现了在仿真环境中进行四个家具装配任务并直接从 RGB 图像中组装多达五个零件,性能超过了模仿学习和数据增强的基线。
Apr, 2024
本文介绍了如何利用消费级虚拟现实头显和手部追踪硬件来自然地远程操纵机器人执行复杂任务,并说明了如何使用仿真学习来学习从像素到动作的策略映射。实验展示了我们方法在视觉动作技能学习上的有效性。
Oct, 2017
本文介绍了一种用于视觉模仿学习的简单方法,可以从一个人类演示中学习机器人操作任务,而无需先前了解与对象的交互情况,并且可以通过自监督学习进行训练。在实现过程中,该方法将模仿学习建模为状态估计问题,以目标交互开始时末端执行器的姿态作为状态,在自监督训练过程中让末端执行器的摄像头围绕对象自动移动。 最终,在测试时,机器人通过一条线性路径移动到预测的状态,然后简单地重放演示的末端执行器速度,从而获得了一个复杂的交互轨迹,而无需明确学习策略。在常见的 8 个任务上进行的实现结果表明,这种方法可以从单个人类演示中学习出多样的技能,并产生稳定且可解释的控制器。
May, 2021