基于机械臂的仿真到实际深度强化学习用于拾取和放置

Sep, 2023

基于机械臂的仿真到实际深度强化学习用于拾取和放置

Sim-to-Real Deep Reinforcement Learning with Manipulators for Pick-and-place

Wenxing Liu, Hanlin Niu, Robert Skilton, Joaquin Carrasco

TL;DR该研究提出了一种自监督视觉深度强化学习方法，使得机器人可以有效地在模拟环境和真实环境之间直接转移训练模型，并特别设计了一种高度敏感的行动策略用于处理拥挤和堆叠的物体，实验证明即使没有经过实际环境微调，该模型在真实吸附任务中的吸附成功率也能保持较高，还能在真实实验中吸附新物体并保持 90% 的成功率。

Abstract

When transferring a deep reinforcement learning model from simulation to the real world, the performance could be unsatisfactory since the simula

deep reinforcement learning simulation self-supervised vision-based drl pick and place suction task

发现论文，激发创造

无需物体模型的自监督学习精准拾取和放置

该研究提出一种应用基于机器学习的灵活取放技术实现对物体的自主操作方法，通过学习与仿真操作降低了对于物体模型的需求。

Jun, 2020

自监督适应深度神经网络实现机器人视觉操作

使用深度强化学习隐式地在仿真环境中学习潜在的状态表示，并通过无标签的真实机器人数据将其调整到真实环境中，以实现从像素中执行操作任务。通过序列自监督目标优化对比正向动力学损失，提出了一种更加有效的方法，成功地训练基于视觉的强化学习智能体来堆叠方块。

Oct, 2019

无几何对象模型的取放置

本研究提出了一种深度强化学习算法来解决机器人拾取和放置问题，通过将操作定义为手的目标位置并将状态定义为已达到的历史位置，使算法能够在未知对象几何结构情况下解决大量拾取和重抓问题，并只需依靠传感器感知信息和已知的对象一般类别。实验结果表明，该算法明显优于基于形状基元的基准模型。

Jul, 2017

非抓取性操作的强化学习：从仿真到物理系统的转移

本研究使用一种修改自然策略梯度算法的模型，通过模拟学习并训练，成功将自主控制策略从虚拟系统转移到由三个机器人组成的物理系统中，并证明使用多个模型训练可以使学习到的策略更加稳健，从而弥补了系统识别的困难。

Mar, 2018

无需演示学习可变形物体操纵

本文介绍了基于无模型视觉强化学习的变形物体操作问题，通过提出迭代的拾取 - 放置空间和只显式学习放置策略来加速学习，并使用 MVP 选择策略，此学习框架在变形物体操纵任务方面获得了比独立空间快一个数量级的学习，并使用领域随机化将策略转移到 PR2 机器人上，对布料和绳索覆盖任务进行了实验验证。

Oct, 2019

视觉先见：基于模型的深度强化学习在基于视觉的机器人控制中的应用

本文提出了一种实用于实际机器人任务 -- 如机器人操作 -- 的深度强化学习算法，并在无人监督的情况下使用自我监督的基于模型的方法来训练预测模型，通过选择指定像素、目标图像或图像分类器作为目标设定方法，探索实现前所未见的任务和物体的普遍泛化。

Dec, 2018

深度强化学习智能体的实景迁移用于在线覆盖路径规划

通过在仿真环境中训练模型，并在高推理频率下部署，我们成功地将最先进的结果从仿真转移到了真实领域，而直接学习则需要花费几个星期的人工交互，即完全不可行。

Jun, 2024

可变形物体操作的仿真增强学习

采用最先进的深度强化学习算法，通过领域随机化，在仿真环境中训练代理程序以解决可变形物体操作问题，并成功将其部署在实际工作中。

Jun, 2018

基于模拟与实际强化学习的机器人操作：一种基于一致性的方法

本文提出了一个基于深度强化学习的机器人 pick-and-place 任务的共识型模拟现实联合训练算法（CSAR），目的是在模拟和实际环境中都实现高效和有效的策略优化。实验表明，模拟中的最佳策略并不一定适用于模拟和实际环境的学习。同时，越多的模拟代理越有利于模拟现实的训练。

Feb, 2023

DeXtreme: 从模拟到现实的敏捷手持操作转移

本文通过深度强化学习模型，针对转移到真实场景中遇到的困难，提出了学习可以在人形机器人手上进行灵巧操作的策略和一个稳健的姿态估计器。通过在仿真环境中训练的策略，实现了在不同环境下的适应性，并得出了比最佳视觉策略更好的结果，同时在多种硬件和仿真设置中进行了模拟实现，为后续研究提供了方便、低成本的机器人手和摄像机。

Oct, 2022