即时适应：单机器人部署的行为调节

Nov, 2023

即时适应：单机器人部署的行为调节

Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment

Annie S. Chen, Govind Chada, Laura Smith, Archit Sharma, Zipeng Fu...

TL;DR现实世界的机器人需要在训练中未曾见过的情况下适应，本文研究了在部署过程中如何通过采用多样化的先前学习行为库来实时适应新奇场景的问题，提出了一种基于预训练行为的感知价值来选择和调整行为的 ROAM 机制，该机制在测试时的单个情节内完成自适应过程，无需任何人类监督，理论分析和实验表明 ROAM 方法能够使机器人迅速适应动力学变化 - 在模拟和真实环境中成功地在滑轮上行进，比现有方法在面对多样的分布情况时适应性提高了 2 倍以上。

Abstract

To succeed in the real world, robots must cope with situations that differ from those seen during training. We study the problem of adapting on-the-fly to such novel scenarios during deployment, by drawing upon a

robots adaptation roam pre-trained behaviors on-the-fly

发现论文，激发创造

RMA：适用于四足机器人的快速电机适应

该研究论文提出了一种名为 Rapid Motor Adaptation（RMA）的算法，用于解决四足机器人中的实时在线自适应问题。RMA 算法由基本策略和自适应模块两个组成部分组成，这两个部分的组合使机器人能够在几秒钟内适应新的情境，而无需使用任何领域知识。通过基于生物能源启发的奖励，我们在不同的地形上训练了 RMA 并在真实世界和模拟实验中展示了其卓越的性能。

Jul, 2021

飞行中应对杂乱环境的学习敏捷性适应

通过层次学习和规划框架，利用试错和模型生成轨迹的方法，本研究通过在线无模型强化学习和预训练微调奖励机制来赋予飞行器在未知和部分可观察环境中适应敏捷性的能力，并在仿真和实际硬件验证中证明了该方法比常数敏捷度基准和替代方法在飞行效率和安全性方面的优势。

Mar, 2024

走这些路：通过多重行为调整机器人控制以实现泛化

提出了一种结构化家族的行动策略来解决驱动训练任务和应对新任务，并发布了一个快速、稳健、开源的 MoB 行动控制器，“为 Walk These Ways”。

Dec, 2022

在线行为选择实现稳健的现实世界操纵：世界是最好的模型

通过不断监测环境来观察任务的离散高级状态，机器人控制器可以根据不同的传感器模式来决定执行哪些控制器，从而实现对干扰的鲁棒性。我们通过将该思想作为离散状态的概率滤波器来实现这一目标。基于这个框架，我们提出了一个机器人系统，可以惊人地稳定地打开抽屉并从中抓取网球。

May, 2022

自适应开放环境下的关节化物体移动操控

在本研究中，我们介绍了一个全套解决方案，即开放世界移动操作系统，用于处理开放且无结构的环境中的真实关节对象操作，如真实世界中的门、柜子、抽屉和冰箱。我们还开发了一种低成本的移动操作硬件平台，能够在无结构环境中进行安全和自主的在线调整。

Jan, 2024

野外 AMP：学习强健、敏捷、自然的腿部运动技能

本文提出了一种新的算法，可以推断关于动态系统参数的信息，同时从先前的观察中估计有关机器人状态的重要信息，并将其与 Adversarial Motion Priors 结合，实现了机器人在真实世界中稳定、灵活和自然的步态，从实验结果中发现相对于基线算法，我们提出的算法能够以更低的功耗遍历具有挑战性的地形。

Apr, 2023

基于感知驱动的模块化机器人自主系统

通过在未知环境下实现感知、高层规划和模块化硬件的集成，我们展示了一种模块化机器人系统，能够通过反应式重新配置来完成高级任务。该系统在三次硬件演示中得到验证，为模块化自重构机器人应对现实世界任务的设计奠定了基础。

Sep, 2017

机器人机械臂的快速运动适应

研究表明，利用深度感知开发在各种操作任务中迅速适应的代理人可以在实现更好的通用性能和样本效率方面超越自动领域随机化和基于视觉策略的最新方法。

Dec, 2023

使用 RoAM 进行动作条件下的深度视觉预测，适用于自主机器人的新型室内人体运动数据集

介绍了 Robot Autonomous Motion (RoAM) 视频数据集和 ACPNet 视觉预测框架，以促进移动机器人和自主导航研究，该数据集包含 LiDAR 扫描和记录机器人采取的所有控制动作的同步记录。

Jun, 2023

Sim-to-Real: 四足机器人学习敏捷运动

本文提出了一种利用深度强化学习技术自动化四足机器人运动设计过程的系统，能够从简单的奖励信号中学习四足运动，并可提供开环参考进行学习过程的控制，采用系统辨识来改进物理模拟器，利用物理环境随机与扰动设计控制器，并在物理模拟器中进行评估，成功在现实世界中部署。

Apr, 2018