四足机器人数据有效强化学习

Jul, 2019

Data Efficient Reinforcement Learning for Legged Robots

Yuxiang Yang, Ken Caluwaerts, Atil Iscen, Tingnan Zhang, Jie Tan...

TL;DR本文提出了一种基于模型的机器人运动框架，在只采集 4.5 分钟（45,000 个控制步骤）的四足机器人数据的基础上实现了步行，通过引入跟踪多个时间步长上的模型预测的损失函数来准确地建模机器人的动力学，使学习到的模型可以进行实时控制，此方法比当前的无模型方法在样本效率上提高了一个数量级以上。

Abstract

We present a model-based framework for robot locomotion that achieves walking based on only 4.5 minutes (45,000 control steps) of data collected on a →

robot locomotion model-based framework model predictive control quadruped robot sample efficiency

发现论文，激发创造

最小人力学习在现实世界中行走

使用深度强化学习中的多任务学习技术和安全控制框架在实际机器人系统中实现了自动学习四条腿机器人在三种不同地形上的步态。

Feb, 2020

四足行走安全强化学习

本文提出了一种安全的强化学习框架，用于设计控制策略，以确保腿部运动的安全，同时利用无模型的强化学习进行学习任务。在此框架基础上，本文进行了四项步态运动实验，并实现了显著的提升，包括节能、稳定性和动作变化。

Mar, 2022

在公园散步：学习无模型强化学习在 20 分钟内行走

研究展示了在现实世界中通过深度强化学习和机器学习算法，结合先进的机器人控制器，可以在仅 20 分钟内在多个室内和户外地形上学习四足动物的步态，以及对于设计决策的模拟环境评估。

Aug, 2022

深度跟踪控制：用于多功能和鲁棒运动的基于模型规划和强化学习的统一方法

通过结合在线规划的预测能力和离线学习的内在稳健性，我们提出了一个混合控制架构，以同时实现更高的稳健性、脚步精确度和地形泛化。

Sep, 2023

通过经验转移学习和适应敏捷运动技能

这篇论文研究了如何用增强学习算法训练四肢机器人在复杂环境中实现高速奔跑、跳跃、走路到目的地等多种复杂技能，并且通过从已有的控制器中借鉴经验，解决了机器人探索新环境时的困难，实现了四肢机器人在现实环境中优雅且安全的部署。

Apr, 2023

深度强化学习下的行走学习

本文提出了一种基于最大熵强化学习的样本有效的深度强化学习算法，用于学习独立于机器人动力学模型的实际机器人行走姿势，仅需要少量试验即可。实验结果表明，我们的方法可以帮助机器人在约两个小时内直接从零开始建立稳定步态，而不需要任何模型或仿真。同时，我们展现了本算法在单个较佳超参数上实现了最先进的性能，与环境中的适度变化相容。

Dec, 2018

不仅有奖励还有约束：应用于四肢机器人的运动

通过提出一种新颖的深度强化学习框架，我们展示了可用于训练复杂机器人系统的神经网络控制器，该框架通过引入约束条件减少了奖励工程的工作量，并实现了较高的任务绩效。

Aug, 2023

学习四肢机器人灵活动态技能

通过在仿真中训练神经网络策略并将其转移到现实的四足动态平衡系统，研究创造了一种快速、自动且高效的数据生成方案，从而实现了在四足机器人技能方面的进一步提升。

Jan, 2019

继续学习的腿式机器人：在现实世界中微调运动策略

该论文提出了一种基于强化学习的实际机器人强化学习系统，通过在现实世界中微调机器人运动策略的少量训练，实现了 A1 四足机器人在多种环境中自主微调多种运动技能的能力。

Oct, 2021

一个离线强化学习的真实四足行动基准

以离线强化学习方向研究四足机器人腿部鲁棒动作，通过经典模型预测控制方法收集数据集，并与基于模型无关的在线强化学习方法进行对比，发现离线强化学习算法在某些任务上能够超越模型无关的在线强化学习算法，但在稳定性和快速适应性方面仍存在差距，该研究为测试和评估离线强化学习算法在实际四足机器人运动任务中的表现提供了一个发展平台。

Sep, 2023