从人类演示中学习语义感知的运动技能

Jun, 2022

从人类演示中学习语义感知的运动技能

Learning Semantics-Aware Locomotion Skills from Human Demonstration

Yuxiang Yang, Xiangyun Meng, Wenhao Yu, Tingnan Zhang, Jie Tan...

TL;DR该研究提出了一个从感知中学习语义导向运动技能的框架，以使四足机器人可以穿越复杂的越野地形在感知信息的帮助下以适当的速度和步态进行行走。

Abstract

The semantics of the environment, such as the terrain type and property, reveals important information for legged robots to adjust their behaviors. In this work, we present a framework that learns →

legged robots semantics perception off-road terrains quadrupedal robots

发现论文，激发创造

通过操纵学习行走：在动态环境中的感知四足动力学

本文介绍了一个名为 PRELUDE 的层级学习框架，其中包括高层决策和低层步态生成。在该框架中，高层导航控制器用人类演示进行了模仿学习，而低层步态控制器则使用强化学习获得多样化的步态。该方法在仿真和硬件实验中表现出色。

Sep, 2022

快速学习四足动物在复杂地形上的敏捷奔跑

使用无模型强化学习在仿真环境下训练的，基于镜像世界神经网络的四足机器人运动控制器具有极强的抗扰动性能和泛化能力，能够协调机器人的动作频率和运动速度，实现更加自然和合理的运动模式。

Jul, 2022

Sim-to-Real: 四足机器人学习敏捷运动

本文提出了一种利用深度强化学习技术自动化四足机器人运动设计过程的系统，能够从简单的奖励信号中学习四足运动，并可提供开环参考进行学习过程的控制，采用系统辨识来改进物理模拟器，利用物理环境随机与扰动设计控制器，并在物理模拟器中进行评估，成功在现实世界中部署。

Apr, 2018

使用稀疏视觉观察学习在不平坦地形上的感知运动

使用稀疏的视觉观察来实现知觉运动，并提出一种学习框架以有效地学习反馈控制策略，可在人类中心的环境中在道路上行驶，越过不同的障碍，包括台阶、斜坡、间隙和楼梯。

Sep, 2021

四足动物运动的分层强化学习

本文介绍一种利用层次化框架实现四足机器人路径跟踪任务的方法，其中高层策略以潜在空间向低层策略发出指令，并控制其执行的时间，低层策略使用潜在指令和机器人传感器来控制机器人的执行器，以完成任务需求，同时可以实现训练后的低层策略的高效迁移，为实现端到端的层次化深度学习提供了理论支持。

May, 2019

面向移动人机交互的语义感知环境感知

本篇论文提出了一种基于视觉的移动助理机器人系统，能够在无预先知识的情况下实现语义感知环境，并在一个移动的仿人机器人上进行实际应用测试。

Nov, 2022

在未知环境中跟随自然语言指令的学习模型

本文提出了一个新的学习框架，使得机器人可以成功地遵循自然语言路线指令，而无需任何先前环境的知识。该算法利用通过命令传达给机器人的空间和语义信息来学习关于空间扩展环境的度量和语义属性的分布，并将自然语言指令解释为关于预期行为的分布。通过对地图和状态分布进行推理，使用模仿学习的新型置信空间规划器直接求解策略，我们在可声控轮椅上评估了我们的框架。结果表明，通过学习和推理潜在的环境模型，该算法能够成功地遵循新颖的扩展环境中的自然语言路线指令。

Mar, 2015

野外 AMP：学习强健、敏捷、自然的腿部运动技能

本文提出了一种新的算法，可以推断关于动态系统参数的信息，同时从先前的观察中估计有关机器人状态的重要信息，并将其与 Adversarial Motion Priors 结合，实现了机器人在真实世界中稳定、灵活和自然的步态，从实验结果中发现相对于基线算法，我们提出的算法能够以更低的功耗遍历具有挑战性的地形。

Apr, 2023

用腿作为机械臂：推进四足动物的敏捷性超越运动

该论文讨论了如何通过在模拟中训练四足机器人学习步行和使用前腿攀爬墙壁、按按钮、与物品交互等技能，并通过行为树将这些技能结合起来执行任务，并使用分阶段的课程和 sim2real 变体在现实世界中应用这些技能。

Mar, 2023

自我优化的室内定位语义感知

提出了一种新颖的机器人系统，通过持续在线学习和自我监督来适应部署环境，解决了传统机器人学习固定模型的问题。实验结果表明，在语义感知领域的持续学习和回溯有助于降低遗忘风险，提高了分割和定位精度，相比部署固定模型，平均分割提高 60％，定位精度提高 10％。

May, 2021