通过强化学习,我们使用模拟环境训练了一种可以使机器人手指进行多指协调、操纵物体并控制重力的新型算法,并且证明该算法可以成功地应用在实物机器人中,为机器人控制领域提供了新的解决方案。
Aug, 2018
本研究展示了无模型深度强化学习可有效扩展到高维复杂操作任务,并通过少量人工演示显著降低样本复杂度,从而使学习具有与机器人体验几个小时相当的样本量,展示出非常自然的动作并且更加稳健。
Sep, 2017
本研究使用深度学习和强化学习方法解决机器人的熟练操作任务,同样使用了 DDPG 算法来扩展其功能以实现更高效的数据利用与可伸缩性,成功地使用现实世界的抓取和叠放机器人的交互数据训练出其掌握复杂熟练操作技能的有效策略模型。
Apr, 2017
本文提出了一种基于视觉的程序自由编程的方法,利用强化学习实现复杂多指手势下的实物操作,无需手动建模或奖励工程。
Dec, 2022
本文通过深度强化学习模型,针对转移到真实场景中遇到的困难,提出了学习可以在人形机器人手上进行灵巧操作的策略和一个稳健的姿态估计器。通过在仿真环境中训练的策略,实现了在不同环境下的适应性,并得出了比最佳视觉策略更好的结果,同时在多种硬件和仿真设置中进行了模拟实现,为后续研究提供了方便、低成本的机器人手和摄像机。
Oct, 2022
本文介绍了一种在线规划深度动力学模型的方法,通过这种方法,使用少量真实世界的数据即可进行柔性接触的灵巧操作技能的有效学习,并成功应用于 24 个自由度类人手上。
Sep, 2019
该论文介绍了一个基于强化学习的通用物体重新定位控制器,使用廉价深度相机内置单个传感器可以动态地实时重新定位复杂物体,具有在真实世界中重现的能力,且硬件成本低廉,可以使未来的技术民主化。
Nov, 2022
本研究旨在解决机器人技术中的熟练操作难题,特别关注于 TriFinger 系统,提出了基于结构化策略的测试基准,包括了经典机器人学和现代策略优化元素,该基准通过仿真和实际系统验证了基线结果,并对核心特点进行了系统的分析。
May, 2021
本研究提出了使用大规模演示学习熟练操作多指手来处理机器人学中最具挑战性的问题。 主要采用人类抓握可行性模型生成 3D 物体演示,以实现策略的泛化。同时,本研究使用了新颖的模仿学习目标,以及几何表示学习目标,通过在仿真系统中重新定位多样的对象以证明本方法的有效性。
Apr, 2022
我们的研究旨在通过学习一种统一的基于视觉的策略,使多指机械手能够在各种姿势下操纵不同的物体。我们提出了一种新的框架 ViViDex,通过使用强化学习和轨迹引导奖励训练每个视频的基于状态的策略,从而获得视觉自然且物理可行的轨迹,并在不使用任何特权信息的情况下训练出一个统一的视觉策略,该方法通过坐标转换方法显著提升了性能,在三个灵巧操纵任务上展示出了较大的改进。
Apr, 2024