基于分离的深度 Q-Learning 算法实现鲁棒的物体分离

Sep, 2019

基于分离的深度 Q-Learning 算法实现鲁棒的物体分离

Split Deep Q-Learning for Robust Object Singulation

Iason Sarantopoulos, Marios Kiatos, Zoe Doulgeri, Sotiris Malassiotis

TL;DR本文提出了一种推动策略，目的是通过相邻物体和目标物体的横向推动来解决在杂乱环境中从一堆其他物体中提取目标物体的机器人操作问题，使用 DQN 深度强化学习学习最优的推动策略，利用 Split DQN 来提高学习速率和增加算法的模块化。实验证明了该算法在模拟环境中的学习效果，以及其模块化设计可以在不重新训练模型的情况下添加新的算法原语。

Abstract

Extracting a known target object from a pile of other objects in a cluttered environment is a challenging robotic manipulation task encountered in many robotic applications. In such conditions, the target object touches or is covered by adjacent obstacle objects, thus rendering traditi

robotic manipulation cluttered environment pushing policy deep q-learning modularity

发现论文，激发创造

通过 Push 提议网络学习物体分离

使用基于神经网络的方法从具有随机布局的桌面场景采集的数据中训练模型，通过选择合适的推动动作来将未知物体从杂乱的环境中分离，实现机器人在无序环境下执行任务的高成功率和低推动次数。

Jul, 2017

深度强化学习在复杂环境下的机器人推和取

本文提出了一种新颖的机器人抓取系统，由气泡吸盘和机械手抓手组成。利用可供性地图提供像素级的气泡吸盘升力点候选物，并引入主动探索机制，设计了一种有效的度量来计算当前可供性地图的奖励，并使用深度 Q 网络（DQN）指导机器人手探索环境，实验结果表明，所提出的机器人抓取系统能够大大提高在混乱场景中的机器人抓取成功率。

Feb, 2023

深度学习方法在抓取无形对象方面的应用

本篇论文提出了一种基于深度学习的批判 - 策略方法来解决机器人操作中的困难问题，该问题需要通过一系列推进和抓取动作来捕捉最初看不见的目标物体，并通过自我监督学习的方式进行训练。

Sep, 2019

基于分离和抓取方法的自监督交互式物体分割

该研究提出了一种机器人学习方法，利用在未见过新物体时的交互作用，与避免手动标记数据集的费时过程，收集每个物体的训练标签进行微调来提高分段模型的性能。该系统实现了在模拟杂乱场景中 70% 的分离成功率，而对于玩具积木、模拟 YCB 对象和真实世界的新物体，交互式分割的平均精度分别达到了 87.8%、73.9% 和 69.3%，超过了几个基线。

Jul, 2022

在混乱环境中有效学习面向目标的推 - 抓协同技能

本文提出了一种高样本效率的目标导向层次强化学习模型，使用推和抓策略来实现在混乱环境下抓取指定目标物体，经过一系列实验验证表明，该模型表现出了高的任务完成率和目标抓取成功率，并能够适应目标不明确的条件，并且可以直接转移到实际应用中。

Mar, 2021

自我监督的深度强化学习在推动和抓取之间的协同学习

通过无模型深度强化学习，可以从头开始发现和学习机器人操作中的推动和抓取之间的复杂协同作用，并在具有挑战性的混乱情况下提高抓取成功率和拾取效率并实现泛化。

Mar, 2018

分而治之强化学习

提出了一种将初始状态空间划分为不同 ' 切片 ' 并对每个切片上的策略进行优化的 Deep RL 算法，其逐步将这些策略组合为一个能够在整个状态空间上成功的策略，该方法在挑战性的抓握、操纵和运动任务上表现出比常规策略梯度方法更好的性能。

Nov, 2017

学习抓握：从某处到任何地方

通过使用 RGB-D 数据流和视觉技术，本研究提出了一种自动生成并适应新物体姿态的抓取轨迹的方法，通过将轨迹相对于物体框架进行投影，实现了在多个不同机器人设置和物体上的抓取任务的高效执行。

Oct, 2023

使用参数化操作基元学习外在灵巧性

通过学习层次化强化学习，我们能够利用环境改变目标物体的姿态，无需物体检测、姿态估计或手动设计控制器，从而成功地完成 98% 的实验任务。

Oct, 2023

使用 SLAM 增强的深度强化学习玩《毁灭战士》游戏

该研究使用前人认为人类认知中的语义概念和抽象能力，将对象和结构元素添加到图像输入，改进了深度 Q 学习网络（DQN）代理模型的策略学习框架，并在 3D 第一人称射击游戏 “毁灭战士” 中表现出更好和更有效的策略。

Dec, 2016