推进类人机器人步态:掌握具有挑战性的地形与去噪世界模型学习
本文提出了一种新的算法,可以推断关于动态系统参数的信息,同时从先前的观察中估计有关机器人状态的重要信息,并将其与 Adversarial Motion Priors 结合,实现了机器人在真实世界中稳定、灵活和自然的步态,从实验结果中发现相对于基线算法,我们提出的算法能够以更低的功耗遍历具有挑战性的地形。
Apr, 2023
通过结合在线规划的预测能力和离线学习的内在稳健性,我们提出了一个混合控制架构,以同时实现更高的稳健性、脚步精确度和地形泛化。
Sep, 2023
鲁棒的运动控制依赖于准确的状态估计,这篇论文提出了使用混合内部模型(HIM)来估计外部状态,并使用对比学习来优化嵌入响应,从而实现四足机器人在各种地形和干扰下的高度灵活、开放世界的运动控制。
Dec, 2023
为了加快人形机器人算法研究的进展,我们提出了一个基于高维度的模拟机器人学习基准,名为HumanoidBench,该基准以配备熟练双手和各种具有挑战性的全身操作和运动任务的人形机器人为特色。我们的研究发现,当配备稳健的低级策略(如行走或伸手)时,最先进的强化学习算法在大多数任务中表现不佳,而分层学习基准则实现了优越的性能。通过HumanoidBench,我们为机器人学界提供了一个平台,用于解决人形机器人在解决各种任务时所面临的挑战,促进算法和思想的快速验证。开源代码可在此网址获得:https://url
Mar, 2024
在未知地形上行走是为了使双足机器人能够处理新型现实世界挑战、并扩展其在灾难应对和探索中的实用性而必不可少的。本文介绍了一个轻量级框架,学习单一行走控制器在多种地形上实现行走。我们设计了一个基于扩散模型的实时机器人控制器,不仅能在单一策略中捕捉不同速度的多种行为,而且对未知地形具有良好的泛化能力。与在线学习相比,我们的控制器通过离线数据进行学习,在可扩展性和训练方案的简单性等方面更加优越。我们在仿真中使用基于扩散模型的策略控制器在我们自己制造的双足机器人模型Stoch BiRo上进行了设计与实现,展示了它在泛化能力和高频率控制步骤生成方面相对于典型生成模型的优势,后者需要庞大的计算资源。
Jul, 2024
本研究解决了多腿机器人在崎岖地形上运动的效率问题,提出了一种基于强化学习的控制框架,该框架能够动态调整横向和纵向的身体波动及肢体步态。实验结果表明,与线性控制器相比,学习型控制器在现实世界的测试中速度提高了30%到50%,展示了其在复杂地形适应中的潜在影响。
Sep, 2024
本研究解决了传统方法在腿足运动中面临的视觉输入数据效率低下和信息差距的问题。提出了一种基于世界模型的感知方法(WMP),通过构建环境的世界模型来学习策略,从而在模拟与实际环境中均显示出优越的行走能力和鲁棒性,推动了腿足机器人运动的发展。
Sep, 2024
本研究解决了类人机器人在多样地形上行走的控制器开发难题。通过使用变换器模型,从先前的运动观察和动作中预测下一步行动,提出了一种盲行走的学习方法,并在真实机器人上进行评估。实验结果表明,该模型在复杂地形上表现出卓越的适应能力和强大的应对能力,成功完成了在不同地形上的长距离行走。
Oct, 2024
该研究解决了传统平滑技术在机器人平台上需要繁琐手动调优的问题。提出了一种简单有效的方法,采用Lipschitz约束于学习政策,形成“Lipschitz约束政策”(LCP),能够在训练框架中有效地保证平滑行为。实验表明,LCP能够替代平滑奖励和低通滤波器,实现平稳而稳健的人形机器人运动控制。
Oct, 2024
本研究解决了平滑假肢机器人运动控制中存在的手动调节超参数繁琐的问题。作者提出了一种新颖的方法,通过引入Lipschitz约束来定义政策,从而不再依赖传统的平滑技术,实现了有效的自动化训练。研究结果表明,该方法能够为多种类人机器人生成平稳且强健的运动控制器,具有广泛的应用前景。
Oct, 2024