连续灵巧性:将灵巧策略链接起来实现长程操纵
本研究展示了无模型深度强化学习可有效扩展到高维复杂操作任务,并通过少量人工演示显著降低样本复杂度,从而使学习具有与机器人体验几个小时相当的样本量,展示出非常自然的动作并且更加稳健。
Sep, 2017
通过强化学习,我们使用模拟环境训练了一种可以使机器人手指进行多指协调、操纵物体并控制重力的新型算法,并且证明该算法可以成功地应用在实物机器人中,为机器人控制领域提供了新的解决方案。
Aug, 2018
本文提出使用深度强化学习作为一种可扩展的解决方案,来掌握带有多指手的接触丰富行为,并展示使用模型自由的深度强化学习算法在现实世界中可以学习各种复杂的行为,同时可以通过少量的人类演示来加速学习。
Oct, 2018
本文提出了一种基于多任务强化学习算法的重置自由学习方法,可用于实现机器人的复杂困难操作,无需人工干预,实验表明该方法可以有效缩放复杂的问题并实现机器人的技能多样化。
Apr, 2021
提出了双手灵巧操纵仿真器Bi-DexHands,可用于机器人学习多种操纵技巧,其中单一代理策略PPO可达到人类48个月婴儿的操作水平,而多代理策略可进一步帮助掌握需要灵巧双手协作的操作任务,但现有RL算法在多任务和少样本学习设置下仍需要更深入的研究。
Jun, 2022
本文研究了在24 DOF机器人手器学习使用约束策略优化来执行对象重定位任务,并发现在学习期间添加约束能确保机器人更快达到目标点,从而使其具有更加稳健和安全的行为能力。
Jan, 2023
本研究针对强化学习(RL)算法在真实环境中训练的挑战,探索了在可控且现实的设置中进行灵巧操作的直接训练。通过基准测试三种RL算法在复杂手持操作任务中的效果,结果展示了RL训练在实际应用中的实用性及相关挑战,为机器人领域的研究者和从业者提供了宝贵的经验和启示。
Aug, 2024
本研究解决了机器人在复杂顺序任务中的学习难题,特别是在长时间操作任务中缺乏可靠性保证的问题。通过将长时间演示分段并学习全局稳定的动态系统策略,该方法提升了任务成功率,减少了所需训练数据。实验结果表明,该方法在仿真与实际应用中均表现出良好的转移能力,显示了重大的潜在应用价值。
Oct, 2024
本研究针对传统强化学习在真实环境中实现复杂机器人操控技能的困难,提出了一种基于人机协作的视觉强化学习系统,展示了其在多个灵巧操控任务上的优异表现。通过整合示范、人工修正与高效的强化学习算法,该方法在1到2.5小时的训练内实现了近乎完美的成功率和快速的循环时间,显著超越了过去的模仿学习和强化学习方法。
Oct, 2024