抓取一切：将教师增强的策略梯度学习与实例分割相结合，抓取任意物体

Mar, 2024

抓取一切：将教师增强的策略梯度学习与实例分割相结合，抓取任意物体

Grasp Anything: Combining Teacher-Augmented Policy Gradient Learning with Instance Segmentation to Grasp Arbitrary Objects

PDF

Malte Mosbach, Sven Behnke

TL;DR交互抓取从杂乱环境中非常类似于人类灵巧度的问题中，是机器人学习中最久远的问题之一。我们提出了一种新颖的两阶段学习框架 —— 师傅增益策略梯度（TAPG），将强化学习和策略蒸馏相结合。通过训练一位师傅策略以掌握基于物体姿态信息的运动控制，TAPG 能够在基于物体分割的感觉运动策略上实现引导且适应性的学习。我们通过使用面向特定物体分割的 “Segment Anything Model” 从仿真环境零迁移到真实机器人环境。根据人类可理解的提示，我们训练出的策略能够在仿真和现实世界中熟练地从杂乱环境中抓取各种物体。此外，我们展示了对新物体的鲁棒零迁移。我们的实验视频可以在 https://maltemosbach.github.io/grasp_anything 上找到。

Abstract

interactive grasping from clutter, akin to human dexterity, is one of the longest-standing problems in robot learning. Challenges stem from the intricacies of visual perception, the demand for precise motor skills, and the complex interplay between the two. In this work, we present Tea

interactive grasping teacher-augmented policy gradient reinforcement learning policy distillation zero-shot transfer

发现论文，激发创造

基于分离和抓取方法的自监督交互式物体分割

该研究提出了一种机器人学习方法，利用在未见过新物体时的交互作用，与避免手动标记数据集的费时过程，收集每个物体的训练标签进行微调来提高分段模型的性能。该系统实现了在模拟杂乱场景中 70% 的分离成功率，而对于玩具积木、模拟 YCB 对象和真实世界的新物体，交互式分割的平均精度分别达到了 87.8%、73.9% 和 69.3%，超过了几个基线。

Jul, 2022

RoboTAP：用于少样本视觉模仿的任意点追踪

我们探讨了密集跟踪作为一种表征工具，使机器人能够更快、更通用地从示教中学习，并展示了通过密集跟踪生成的稳健机器人策略能够解决复杂的物体排列任务，如形状匹配、堆叠，甚至全路径跟踪任务，如涂胶并粘合物体，这些示教仅需数分钟即可收集。

Aug, 2023

通过交互式分割和少样本学习，由非专家远程教授任务导向的抓取区域

本论文提出了一个新的两步框架，使机器人在非结构化环境中学会抓取并能够从远程的非专家演示中学习，通过分割的方式进行操作，在进行少量示范的情况下估计给定任务的未见场景所需的抓取区域，并有效地允许非专家进行新的抓取策略的远程教学。

Mar, 2023

深度学习方法在抓取无形对象方面的应用

本篇论文提出了一种基于深度学习的批判 - 策略方法来解决机器人操作中的困难问题，该问题需要通过一系列推进和抓取动作来捕捉最初看不见的目标物体，并通过自我监督学习的方式进行训练。

Sep, 2019

适应性策略学习用于附加任务

本文提出一种名为 APG 的方法，结合 Bellman 最优原理和策略梯度方法，优化预训练策略以适应额外任务并保证收敛速率和样本复杂度，同时在多个数值模拟中表现良好。

May, 2023

GAPLE: 室内环境中机器人物体搜索的通用接近策略学习

探讨一种可学习到的通用行动策略用于室内环境中仅通过视觉输入主动接近感兴趣的物体，提出了一种基于深度和语义分割作为策略学习模块输入的新解决方案 GAPLE，通过实证研究在 House3D 数据集上和真实世界情境中的物理平台上进行验证并提供了深入的定性分析。

Sep, 2018

AdaGrasp: 学习自适应夹具感知抓取策略

该论文提出了 AdaGrasp 方法，通过使用大量的末端执行器、模拟训练以及视觉观察来学习一种单一的抓取策略并解决机器人在处理碎片化视角和杂乱无章的环境中遇到的挑战。

Nov, 2020

深度学习图像增强的对抗策略梯度

提出了深度强化学习框架 Adversarial Policy Gradient Augmentation (APGA)，利用语义分割进行图像增强，实验表明该方法在医学图像分类任务中有较好的表现。

Sep, 2019

通过把握进行自监督实例分割

提出一种自我监督的方法，利用机器人的抓取交互收集实例分割模型的分割监督，该方法可以在没有昂贵的人工注释的情况下，通过对成千上万的抓取交互进行分割来帮助机器人从图像中剪切和粘贴出物体，并显示其对于实例分割任务的重要性。

May, 2023

学习基于评分的人类辅助灵巧抓取基元

提出了一种新的人机辅助灵巧抓取任务，该任务旨在训练一个用于控制机器人手指来辅助用户抓取物体的策略。通过提出 Grasping Gradient Field（GraspGF）和基于历史的剩余策略，解决了用户意图多样性和物体几何形状的挑战，实验证明了该方法在实际应用中的用户感知和实用性的优越性。

Sep, 2023