采用分层式 Sim2Real 实现的多智能体运动操控
本文提出了一种新的机器人操作方法,该方法利用了物体本身的运动学习,通过使用物理模拟器中的对象运动策略生成辅助奖励,称为模拟运动演示奖励(SLDRs),该方法可以在不需要人类演示或昂贵成本的情况下,通过强化学习来掌握机器人操作技能,从而实现多物体堆放和非刚性物体操作等任务的更高成功率和更快学习。
Oct, 2019
本文提出了一个基于深度强化学习的机器人 pick-and-place 任务的共识型模拟现实联合训练算法(CSAR),目的是在模拟和实际环境中都实现高效和有效的策略优化。实验表明,模拟中的最佳策略并不一定适用于模拟和实际环境的学习。同时,越多的模拟代理越有利于模拟现实的训练。
Feb, 2023
该研究探讨如何使用强化学习针对具有挑战的双臂机器人任务,通过模拟训练,实现直接传递未经过滤的观察信息到神经网络模型并保证仿真环境与实际情况一致。设计了一个基于磁力连接的联结任务,通过两个 xArm6 机器人,并在此基础上验证了该强化学习方法的可行性,对于成功拾取方块和连结任务的成功率分别达到了 100%和 65%。
Mar, 2022
提出使用增强学习学习整体控制策略来实现对四肢机器人的控制,以解决四肢协调和模块间错误传播的问题,该统一策略可在多种任务设置中展示动态和敏捷行为。
Oct, 2022
利用 GPU 模拟技术和模仿学习指导策略搜索以使强化学习培训可在高维机器人手表现复杂控制问题的领域中成为可能,最终演示了并行强化学习和模仿学习的互补优势和优秀的验证结果。
Dec, 2022
本文介绍了一种新颖的交互式多对象搜索任务,并提出了一种层次强化学习方法,学习探索、导航和操作技能,该方法在模拟和实际的实验中展示了零样本迁移和对不同机器人运动学的适应性。
Jul, 2023
通过深度学习和强化学习相结合的方法,本文提出了一种学习策略来解决机器人的操纵任务,并展示了比先前方法更高的样本效率、对未见过任务的适应性以及在实际约束条件下复杂性设计和控制策略之间的权衡。
Nov, 2023
本文中,我们使用深度强化学习(RL)技术并结合由磁性方块组成的任务测试平台,通过在模拟环境中培训控制器并将其转移到真实机器人上,成功地实现了一个双臂机器人装配任务,证明了模拟转现技术在双臂机器人装配中的应用前景。
Mar, 2023
本文提出了一种名为 ReLMoGen 的 Reinforcement Learning 方法,通过将行动空间提升到更高的阶级形式 —— 子目标,使用基于采样的运动规划器有效解决了传统方法无法解决的长期复杂任务,比如交互式导航和移动机器人操作等。在照片级仿真环境下测试表明,ReLMoGen 在多项机器人任务中表现优异,并具有良好的跨越不同运动生成器的转移能力。
Aug, 2020
通过强化学习在模拟环境中训练机器人并结合补充奖励策略,与真实机器人进行进一步的微调来优化探索策略,实验结果表明,这种相互对齐的方法可以在真实和模拟环境中实现更好的性能。
Jul, 2017