双手扭开盖
本文提出使用深度强化学习作为一种可扩展的解决方案,来掌握带有多指手的接触丰富行为,并展示使用模型自由的深度强化学习算法在现实世界中可以学习各种复杂的行为,同时可以通过少量的人类演示来加速学习。
Oct, 2018
通过强化学习,我们使用模拟环境训练了一种可以使机器人手指进行多指协调、操纵物体并控制重力的新型算法,并且证明该算法可以成功地应用在实物机器人中,为机器人控制领域提供了新的解决方案。
Aug, 2018
本研究展示了无模型深度强化学习可有效扩展到高维复杂操作任务,并通过少量人工演示显著降低样本复杂度,从而使学习具有与机器人体验几个小时相当的样本量,展示出非常自然的动作并且更加稳健。
Sep, 2017
提出了双手灵巧操纵仿真器 Bi-DexHands,可用于机器人学习多种操纵技巧,其中单一代理策略 PPO 可达到人类 48 个月婴儿的操作水平,而多代理策略可进一步帮助掌握需要灵巧双手协作的操作任务,但现有 RL 算法在多任务和少样本学习设置下仍需要更深入的研究。
Jun, 2022
该研究探讨如何使用强化学习针对具有挑战的双臂机器人任务,通过模拟训练,实现直接传递未经过滤的观察信息到神经网络模型并保证仿真环境与实际情况一致。设计了一个基于磁力连接的联结任务,通过两个 xArm6 机器人,并在此基础上验证了该强化学习方法的可行性,对于成功拾取方块和连结任务的成功率分别达到了 100%和 65%。
Mar, 2022
通过引入 Continual Policy Distillation(CPD)框架,该研究介绍了一种实现多功能控制器的方法,以用于四指软抓手对不同形状和大小的物体进行旋转操作的柔性机器人手。该框架利用策略蒸馏(PD)从专家策略向不断发展的学生策略网络传递知识,并集成样本回放方法以增强泛化能力和避免灾难性遗忘。研究结果表明,CPD 框架在整合多个专家知识和实现多功能自适应手部操作任务方面具有较好的性能。
Apr, 2024
本文通过深度强化学习模型,针对转移到真实场景中遇到的困难,提出了学习可以在人形机器人手上进行灵巧操作的策略和一个稳健的姿态估计器。通过在仿真环境中训练的策略,实现了在不同环境下的适应性,并得出了比最佳视觉策略更好的结果,同时在多种硬件和仿真设置中进行了模拟实现,为后续研究提供了方便、低成本的机器人手和摄像机。
Oct, 2022
本文介绍了一种基于物体为中心示范实现的,用于训练软机械手进行熟练操作的方法,该方法使用增强学习技术,提出了一种新的算法,允许我们混合和选择最可行的示范来学习在硬件上模仿。最后,我们将这种方法应用于 RBO Hand 2 上,并获得了开 / 关阀门,滑珠和抓取等任务的良好表现。
Mar, 2016
该论文介绍了一个基于强化学习的通用物体重新定位控制器,使用廉价深度相机内置单个传感器可以动态地实时重新定位复杂物体,具有在真实世界中重现的能力,且硬件成本低廉,可以使未来的技术民主化。
Nov, 2022