高精度装配任务的深度强化学习

Aug, 2017

Deep Reinforcement Learning for High Precision Assembly Tasks

Tadanobu Inoue, Giovanni De Magistris, Asim Munawar, Tsuyoshi Yokoya, Ryuki Tachibana

TL;DR通过强化学习训练循环神经网络，机器人成功地在高精度装配机械零件过程中，表现出更高的精度和鲁棒性。

Abstract

High precision assembly of mechanical parts requires accuracy exceeding the robot precision. Conventional part mating methods used in the current manufacturing requires tedious tuning of numerous parameters befor

robot precision assembly recurrent neural network reinforcement learning 7-axis articulated robot arm

发现论文，激发创造

利用过程生成提升太空中自主钉孔装配的学习

通过深度强化学习，在高度并行化的仿真环境中，利用程序生成和域随机化的方法，提出了一种新颖的学习自主针孔装配的方法，以增强自主系统的泛化性和适应性，评估了三种不同的强化学习算法，并展示了智能机器人系统在太空中学习中的潜力。

May, 2024

对称感知强化学习在部分可观测条件下软手腕机器人装配中的应用

这项研究使用软手腕来解决机器人装配中具有代表性且具有挑战性的插入孔位任务，其可以比刚性手腕更安全操作且容忍较低频率的控制信号。我们使用部分可观察的形式并通过展示学习和基于记忆的深度强化学习来训练一个完全基于触觉和本体感知信号行动的智能体。此外，我们利用潜在的领域对称性以提高样本效率，并通过构建辅助损失推动智能体遵守对称性。在模拟环境中，我们的智能体在五个不同的对称插头形状上显示出与基于状态的智能体相当甚至更好的性能。特别是，样本效率还使我们能够在 3 小时内直接在真实机器人上学习。

Feb, 2024

从 CAD 学习机器人装配

以制造业的最新趋势为背景，研究了自主机器人装配的问题。提出一种利用几何运动规划作为先验知识来引导强化学习的方法，以实现高精度的装配任务。同时，还提出了一种能够学习运动规划并将控制器推广到物体位置变化的神经网络架构。

Mar, 2018

混凝土孔洞的楔入孔任务策略

为了避免混凝土高摩擦系数的负面影响，本文提出了一种使工业机器人能够完成混凝土孔洞中的桩入洞任务的方法。该方法利用经过强化学习训练的深度神经网络来有效地找到具有不同形状和表面处理的孔洞，而无需进行分析建模或控制参数调整。经过评估，结果显示该神经网络具有 96.1％的平均成功率和 12.5 秒的平均执行时间，验证了该方法在建筑行业的有效性和适用性。

Mar, 2024

使用深度强化学习实现可变插座位置的实用插入方法

利用深度强化学习，在少量人类演示的情况下，无需模拟和建模就能达到高效且稳健地解决插入问题的效果，且在插入位置具有差异的情况下依然有效。

Oct, 2018

接触丰富操作中的强化学习知识迁移

本文介绍了一种基于多个技能先验的强化学习方法，通过学习每个任务所需技能的先验分布，并将任务的相似性与先前的任务进行比较，以指导在新任务上学习策略，从而更好地推广到训练中从未遇到的新任务。

Sep, 2022

应用深度强化学习解决带用户偏好装配序列规划问题

本文提出了一种采用深度强化学习方法解决装配序列规划（ASP）问题的方法，使用用户偏好和总装配时间作为奖励信号，并引入参数化行为来提高训练时间和样本效率。研究结果表明，深度强化学习与人类互动解决装配序列规划问题具有潜在的应用前景。

Apr, 2023

使用低成本硬件学习精细双手操作

我们提出了一种低成本的系统，该系统可以直接从真实演示中进行端到端模仿学习，以学习在现实世界中执行精细操作任务的方法。

Apr, 2023

可变条件下稳健的插销孔任务的视觉空间注意力与本体感驱动强化学习

建筑中用于混凝土孔的铆钉插入是一个钉孔任务，为了减轻自动化这一任务所面临的挑战，我们引入了一个针对光照和孔面条件具有鲁棒性的视觉和感知数据驱动的机器人控制模型。该模型通过空间注意点网络和深度增强学习策略的联合训练，以端到端的方式来控制机器人。该模型通过离线训练，在减少训练时间和最小化将模型转移到实际世界时的现实差距方面具有高效率。通过在 12 个未知孔上进行工业机器人的评估实验，从 16 个不同的初始位置开始，并在三种不同的照明条件下（其中两种有误导性阴影），我们证明了空间注意点网络即使在具有挑战性的光照条件下也能够生成相关的图像关注点。我们还展示了所提出的模型使任务执行的成功率更高，并且任务完成时间更短，高于各种基准。由于所提出的模型在严峻的光照、初始位置和孔条件下的高效性，以及离线训练框架的高样本效率和短训练时间，这种方法可以很容易地应用于建筑领域。

Dec, 2023

强化学习与演示的工业装配鲁棒多模态策略：一个大规模研究

通过与基于传统工程方法的专业工业集成器的比较，研究表明基于深度强化学习的工业装配方法不仅可以超越已有的工业装配方法，还能超越人类运动系统，并且数据说明还有巨大的优化空间。

Mar, 2021