无需物体模型的自监督学习精准拾取和放置

Jun, 2020

无需物体模型的自监督学习精准拾取和放置

Self-supervised Learning for Precise Pick-and-place without Object Model

Lars Berscheid, Pascal Meißner, Torsten Kröger

TL;DR该研究提出一种应用基于机器学习的灵活取放技术实现对物体的自主操作方法，通过学习与仿真操作降低了对于物体模型的需求。

Abstract

flexible pick-and-place is a fundamental yet challenging task within robotics, in particular due to the need of an object model for a simple target pose definition. In this work, the robot instead learns to pick-and-place objects using →

flexible pick-and-place robot learning planar manipulation imitation learning self-supervised learning

发现论文，激发创造

无几何对象模型的取放置

本研究提出了一种深度强化学习算法来解决机器人拾取和放置问题，通过将操作定义为手的目标位置并将状态定义为已达到的历史位置，使算法能够在未知对象几何结构情况下解决大量拾取和重抓问题，并只需依靠传感器感知信息和已知的对象一般类别。实验结果表明，该算法明显优于基于形状基元的基准模型。

Jul, 2017

学习如何将新物体放置在场景中

本文针对机器人在无序的环境中进行多物体放置提出了一种学习方法，通过设计适当特征和运用图形模型对各种属性进行编码，并在模型中运用整数线性规划进行推理和求解，最终在 16 个品类、40 个区域内对 98 个物体进行了广泛的评估和实验，其结果表明本方法在对已知物体放置情况的成功率达 98%，并且在对新物体进行稳定放置的情况下成功率为 82%。

Feb, 2012

基于机械臂的仿真到实际深度强化学习用于拾取和放置

该研究提出了一种自监督视觉深度强化学习方法，使得机器人可以有效地在模拟环境和真实环境之间直接转移训练模型，并特别设计了一种高度敏感的行动策略用于处理拥挤和堆叠的物体，实验证明即使没有经过实际环境微调，该模型在真实吸附任务中的吸附成功率也能保持较高，还能在真实实验中吸附新物体并保持 90% 的成功率。

Sep, 2023

任务驱动的知觉和操作：未知物体的约束放置

该论文提出了一种使用简单容积表示法进行机器人夹取和约束放置的算法框架，并通过真实物理实验展示了该方法的成功率和更快的执行时间。

Jun, 2020

无需演示学习可变形物体操纵

本文介绍了基于无模型视觉强化学习的变形物体操作问题，通过提出迭代的拾取 - 放置空间和只显式学习放置策略来加速学习，并使用 MVP 选择策略，此学习框架在变形物体操纵任务方面获得了比独立空间快一个数量级的学习，并使用领域随机化将策略转移到 PR2 机器人上，对布料和绳索覆盖任务进行了实验验证。

Oct, 2019

倒推学习：通过挑选学习摆放

通过反转抓取过程并利用抓取和放置问题的对称性，我们提出了自动收集放置任务学习示范的方法 Learning to Place by Picking (LPP)。通过触觉感知和顺应性控制结合，我们的系统能够在无人干预的情况下收集数百个示范，并通过行为克隆直接从视觉观察中训练策略。在家庭机器人场景中进行验证，包括装载洗碗机和摆台餐具，我们的方法得到了优于基于肌动学教学的策略的结果，同时无需人类监督。

Dec, 2023

将语言与取放物任务结合

本研究提出了一种基于自然语言指令的机器人系统，通过对话解决歧义，推断出物体及其关系，能够按照用户表达的空间关系成功地放置物体，具有较好的放置效果。

Feb, 2021

超越选取和放置：应对多样形状的机器人堆叠

本文使用增强学习方法和视觉技术在真实环境中完成对复杂物体进行叠放的任务，重点研究了这种方法的优越性和训练问题。

Oct, 2021

规划机器人放置以进行物体抓取

通过利用机器人的可达性、环境的 RGB-D 图像和占用栅格图，提出了一种服务机器人工作流中的机器人位置选择算法，通过选择机器人位置以实现成功抓取目标对象，从而与现有的基线实现相比，改善了机器人在具有挑战性位置上抓取目标物体的能力。

May, 2024

SPOTS: 半自主遥操作系统中稳定物体放置与推理

在本文中，我们研究了机器人技术中的一个基本任务 —— 拾取和放置。通过结合仿真驱动的物理稳定性验证和大型语言模型的语义推理能力，我们提出的方法能够在给定上下文信息的情况下，输出放置任务的可能候选位置的概率分布，考虑到任务的稳定性和合理性。我们在两个仿真环境和一个真实环境中对我们的方法进行了广泛评估，并展示了我们的方法在考虑用户偏好的情况下，显著提高了放置任务的物理可信度和上下文合理性。

Sep, 2023