Nov, 2023

即时适应:单机器人部署的行为调节

TL;DR现实世界的机器人需要在训练中未曾见过的情况下适应,本文研究了在部署过程中如何通过采用多样化的先前学习行为库来实时适应新奇场景的问题,提出了一种基于预训练行为的感知价值来选择和调整行为的 ROAM 机制,该机制在测试时的单个情节内完成自适应过程,无需任何人类监督,理论分析和实验表明 ROAM 方法能够使机器人迅速适应动力学变化 - 在模拟和真实环境中成功地在滑轮上行进,比现有方法在面对多样的分布情况时适应性提高了 2 倍以上。