最小人力学习在现实世界中行走
本文提出了一种基于最大熵强化学习的样本有效的深度强化学习算法,用于学习独立于机器人动力学模型的实际机器人行走姿势,仅需要少量试验即可。实验结果表明,我们的方法可以帮助机器人在约两个小时内直接从零开始建立稳定步态,而不需要任何模型或仿真。同时,我们展现了本算法在单个较佳超参数上实现了最先进的性能,与环境中的适度变化相容。
Dec, 2018
本研究基于深度强化学习控制器的支持下,通过学习遵循给定步长序列的原则,利用程序生成的步长方案实现了全向行走、原地转弯、站立和爬楼梯等多项功能,同时具备适应性强、无需预训练权重、不依赖参考动作等特点,为改进人形机器人在现实环境中行走鲁棒性提供了新思路。
Jul, 2022
该论文提出了一种基于强化学习的实际机器人强化学习系统,通过在现实世界中微调机器人运动策略的少量训练,实现了 A1 四足机器人在多种环境中自主微调多种运动技能的能力。
Oct, 2021
研究展示了在现实世界中通过深度强化学习和机器学习算法,结合先进的机器人控制器,可以在仅 20 分钟内在多个室内和户外地形上学习四足动物的步态,以及对于设计决策的模拟环境评估。
Aug, 2022
基于 APRL 的深度强化学习 (RL) 框架,使四足机器人能够在现实世界中通过高效的训练学会行走,并且不断改进适应各种挑战性情况和动力学的变化。
Oct, 2023
使用深度强化学习(RL)创建动态双足机器人的运动控制器的综合研究,包括开发可用于周期性行走、跑步、跳跃和站立等一系列动态双足技能的通用控制解决方案,该 RL 控制器采用新颖的双重历史架构,通过长期和短期的输入 / 输出(I/O)历史数据有效训练,并在模拟和实际世界的各种技能中始终表现优秀。
Jan, 2024
本文提出了一种安全的强化学习框架,用于设计控制策略,以确保腿部运动的安全,同时利用无模型的强化学习进行学习任务。在此框架基础上,本文进行了四项步态运动实验,并实现了显著的提升,包括节能、稳定性和动作变化。
Mar, 2022
这篇论文研究了如何用增强学习算法训练四肢机器人在复杂环境中实现高速奔跑、跳跃、走路到目的地等多种复杂技能,并且通过从已有的控制器中借鉴经验,解决了机器人探索新环境时的困难,实现了四肢机器人在现实环境中优雅且安全的部署。
Apr, 2023
本文提出了一种基于模型的机器人运动框架,在只采集 4.5 分钟(45,000 个控制步骤)的四足机器人数据的基础上实现了步行,通过引入跟踪多个时间步长上的模型预测的损失函数来准确地建模机器人的动力学,使学习到的模型可以进行实时控制,此方法比当前的无模型方法在样本效率上提高了一个数量级以上。
Jul, 2019