SoftGym: 可变形物体操纵深度强化学习基准测试

Nov, 2020

SoftGym: 可变形物体操纵深度强化学习基准测试

SoftGym: Benchmarking Deep Reinforcement Learning for Deformable Object Manipulation

Xingyu Lin, Yufei Wang, Jake Olkin, David Held

TL;DR本文介绍了 SoftGym，一个开源的、用于操纵可变形物体的模拟基准测试集。它可以用于研究深度强化学习技术在高位状态表示和复杂动态环境下的可行性，并且本文针对用于解决这一问题的算法进行了实验和分析。

Abstract

Manipulating deformable objects has long been a challenge in robotics due to its high dimensional state representation and complex dynamics. Recent success in →

deformable objects deep reinforcement learning softgym manipulation high dimensional state representation

发现论文，激发创造

可变形物体操作的仿真增强学习

采用最先进的深度强化学习算法，通过领域随机化，在仿真环境中训练代理程序以解决可变形物体操作问题，并成功将其部署在实际工作中。

Jun, 2018

RMBench：机器人操作器控制深度强化学习基准测试

本文介绍了 RMBench，这是一个用于机器人操作的基准测试，使用深度学习和强化学习算法，通过使用目标性能指标来比较算法的性能表现，研究发现，软 Actor-Critic 的表现最好，且数据增强技术有助于学习策略。

Oct, 2022

DiffSkill: 从可微分物理学中抽象技能用于工具对形变物体的操作

本研究提出了一个名为 DiffSkill 的新框架，使用可微分的物理模拟器进行技能抽象，从感官观测中解决长期目标可达的可变形物体操作任务。

Mar, 2022

DexDeform: 通过人类演示和可微分物理实现灵巧的可变形物体操作

本文提出了 DexDeform，这是一种从人类示范中抽象出熟练操作技能并通过可微分物理学进行改进的原则性框架，该框架旨在学习多指手指对可变形物体的熟练操作，并通过新颖的探索策略以及基于想象的行动计划来提高操作的成功率。

Mar, 2023

从专家演示中学习可变形物体操作

本论文提出了一种新颖的基于演示的学习方法 —— 来自演示的可变形操作（DMfD），用于解决可变形操纵任务，它能够有效地处理高维空间和图像观测，并在 SoftGym 组件上取得了较高的性能。同时，本文还在两个具有挑战性的环境中进行了折叠布料任务的基准测试，并将 DMfD 运用于真实机器人中，与仿真损失相比性能损失最小。

Jul, 2022

PlasticineLab：一项带有可微物理特性的软体操纵基准测试

介绍了可微分物理实验基准 PasticineLab，它包括一系列软体操纵任务，并评估了针对该基准的强化学习和梯度优化方法。实验结果表明，基于 RL 的方法难以高效解决大多数任务，而基于梯度的方法可以在几十次迭代内快速找到解决方案，但在需要长期规划的多阶段任务上仍然表现不佳。我们期望 PasticineLab 将鼓励开发结合可微分物理和 RL 的新算法，以实现更复杂的基于物理的技能学习任务。

Apr, 2021

safe-control-gym：机器人安全学习控制和强化学习一个统一的基准测试套件

提出了一个名为 safe-control-gym 的新开源基准套件，支持模型和数据驱动控制技术，在 3 个动态系统和 2 个控制任务上提供实现，并建议将 OpenAI 的 Gym API 扩展为支持符号动态和限制条件的查询，并演示如何使用 safe-control-gym 来量化比较传统控制、基于学习的控制和强化学习的多种方法的控制性能、数据效率和安全性。

Sep, 2021

DefGoalNet：针对可变形物体处理的从演示中学习上下文目标

通过开发新颖的神经网络 DefGoalNet，我们解决了依赖于目标形状规范的问题，该网络可以直接从少量人类演示中学习可变形物体的目标形状，并在各种机器人任务中证明了方法的有效性，甚至在手术复位任务中，即使只使用 10 个演示，我们的方法也能够达到近 90% 的成功率，这些结果大大推动了形状伺服方法接近实际的实际应用。

Sep, 2023

基于本地 GNN 的深度强化学习用于目标驱动的变形物体重新排列

使用基于 GNN 的学习方法，通过两个表示图对图像中检测到的关键点进行编码。采用自注意力进行图更新和交叉注意力进行生成操作，实验表明该框架在多个 1-D 和 2-D 重排任务中非常有效，并且可以通过微调关键点检测器轻松转移到真实机器人中。

Feb, 2023

DeXtreme: 从模拟到现实的敏捷手持操作转移

本文通过深度强化学习模型，针对转移到真实场景中遇到的困难，提出了学习可以在人形机器人手上进行灵巧操作的策略和一个稳健的姿态估计器。通过在仿真环境中训练的策略，实现了在不同环境下的适应性，并得出了比最佳视觉策略更好的结果，同时在多种硬件和仿真设置中进行了模拟实现，为后续研究提供了方便、低成本的机器人手和摄像机。

Oct, 2022