高精度装配任务的深度强化学习
通过深度强化学习,在高度并行化的仿真环境中,利用程序生成和域随机化的方法,提出了一种新颖的学习自主针孔装配的方法,以增强自主系统的泛化性和适应性,评估了三种不同的强化学习算法,并展示了智能机器人系统在太空中学习中的潜力。
May, 2024
这项研究使用软手腕来解决机器人装配中具有代表性且具有挑战性的插入孔位任务,其可以比刚性手腕更安全操作且容忍较低频率的控制信号。我们使用部分可观察的形式并通过展示学习和基于记忆的深度强化学习来训练一个完全基于触觉和本体感知信号行动的智能体。此外,我们利用潜在的领域对称性以提高样本效率,并通过构建辅助损失推动智能体遵守对称性。在模拟环境中,我们的智能体在五个不同的对称插头形状上显示出与基于状态的智能体相当甚至更好的性能。特别是,样本效率还使我们能够在 3 小时内直接在真实机器人上学习。
Feb, 2024
以制造业的最新趋势为背景,研究了自主机器人装配的问题。提出一种利用几何运动规划作为先验知识来引导强化学习的方法,以实现高精度的装配任务。同时,还提出了一种能够学习运动规划并将控制器推广到物体位置变化的神经网络架构。
Mar, 2018
为了避免混凝土高摩擦系数的负面影响,本文提出了一种使工业机器人能够完成混凝土孔洞中的桩入洞任务的方法。该方法利用经过强化学习训练的深度神经网络来有效地找到具有不同形状和表面处理的孔洞,而无需进行分析建模或控制参数调整。经过评估,结果显示该神经网络具有 96.1%的平均成功率和 12.5 秒的平均执行时间,验证了该方法在建筑行业的有效性和适用性。
Mar, 2024
本文介绍了一种基于多个技能先验的强化学习方法,通过学习每个任务所需技能的先验分布,并将任务的相似性与先前的任务进行比较,以指导在新任务上学习策略,从而更好地推广到训练中从未遇到的新任务。
Sep, 2022
本文提出了一种采用深度强化学习方法解决装配序列规划(ASP)问题的方法,使用用户偏好和总装配时间作为奖励信号,并引入参数化行为来提高训练时间和样本效率。研究结果表明,深度强化学习与人类互动解决装配序列规划问题具有潜在的应用前景。
Apr, 2023
建筑中用于混凝土孔的铆钉插入是一个钉孔任务,为了减轻自动化这一任务所面临的挑战,我们引入了一个针对光照和孔面条件具有鲁棒性的视觉和感知数据驱动的机器人控制模型。该模型通过空间注意点网络和深度增强学习策略的联合训练,以端到端的方式来控制机器人。该模型通过离线训练,在减少训练时间和最小化将模型转移到实际世界时的现实差距方面具有高效率。通过在 12 个未知孔上进行工业机器人的评估实验,从 16 个不同的初始位置开始,并在三种不同的照明条件下(其中两种有误导性阴影),我们证明了空间注意点网络即使在具有挑战性的光照条件下也能够生成相关的图像关注点。我们还展示了所提出的模型使任务执行的成功率更高,并且任务完成时间更短,高于各种基准。由于所提出的模型在严峻的光照、初始位置和孔条件下的高效性,以及离线训练框架的高样本效率和短训练时间,这种方法可以很容易地应用于建筑领域。
Dec, 2023
通过与基于传统工程方法的专业工业集成器的比较,研究表明基于深度强化学习的工业装配方法不仅可以超越已有的工业装配方法,还能超越人类运动系统,并且数据说明还有巨大的优化空间。
Mar, 2021