无需物体模型的自监督学习精准拾取和放置
本研究提出了一种深度强化学习算法来解决机器人拾取和放置问题,通过将操作定义为手的目标位置并将状态定义为已达到的历史位置,使算法能够在未知对象几何结构情况下解决大量拾取和重抓问题,并只需依靠传感器感知信息和已知的对象一般类别。实验结果表明,该算法明显优于基于形状基元的基准模型。
Jul, 2017
本文针对机器人在无序的环境中进行多物体放置提出了一种学习方法,通过设计适当特征和运用图形模型对各种属性进行编码,并在模型中运用整数线性规划进行推理和求解,最终在 16 个品类、40 个区域内对 98 个物体进行了广泛的评估和实验,其结果表明本方法在对已知物体放置情况的成功率达 98%,并且在对新物体进行稳定放置的情况下成功率为 82%。
Feb, 2012
该研究提出了一种自监督视觉深度强化学习方法,使得机器人可以有效地在模拟环境和真实环境之间直接转移训练模型,并特别设计了一种高度敏感的行动策略用于处理拥挤和堆叠的物体,实验证明即使没有经过实际环境微调,该模型在真实吸附任务中的吸附成功率也能保持较高,还能在真实实验中吸附新物体并保持 90% 的成功率。
Sep, 2023
本文介绍了基于无模型视觉强化学习的变形物体操作问题,通过提出迭代的拾取 - 放置空间和只显式学习放置策略来加速学习,并使用 MVP 选择策略,此学习框架在变形物体操纵任务方面获得了比独立空间快一个数量级的学习,并使用领域随机化将策略转移到 PR2 机器人上,对布料和绳索覆盖任务进行了实验验证。
Oct, 2019
通过反转抓取过程并利用抓取和放置问题的对称性,我们提出了自动收集放置任务学习示范的方法 Learning to Place by Picking (LPP)。通过触觉感知和顺应性控制结合,我们的系统能够在无人干预的情况下收集数百个示范,并通过行为克隆直接从视觉观察中训练策略。在家庭机器人场景中进行验证,包括装载洗碗机和摆台餐具,我们的方法得到了优于基于肌动学教学的策略的结果,同时无需人类监督。
Dec, 2023
通过利用机器人的可达性、环境的 RGB-D 图像和占用栅格图,提出了一种服务机器人工作流中的机器人位置选择算法,通过选择机器人位置以实现成功抓取目标对象,从而与现有的基线实现相比,改善了机器人在具有挑战性位置上抓取目标物体的能力。
May, 2024
在本文中,我们研究了机器人技术中的一个基本任务 —— 拾取和放置。通过结合仿真驱动的物理稳定性验证和大型语言模型的语义推理能力,我们提出的方法能够在给定上下文信息的情况下,输出放置任务的可能候选位置的概率分布,考虑到任务的稳定性和合理性。我们在两个仿真环境和一个真实环境中对我们的方法进行了广泛评估,并展示了我们的方法在考虑用户偏好的情况下,显著提高了放置任务的物理可信度和上下文合理性。
Sep, 2023