Sep, 2024

通过自主实世界强化学习持续改进移动操控

TL;DR本研究解决了移动操控领域缺乏有效自主学习框架的问题。通过引入任务相关的自主性、行为先验的知识以及通用奖励机制,我们提出了一种新方法,使得机器人能够在没有大量外部设备或人工监督的情况下自我提升。研究表明,该方法使得Spot机器人在四项复杂的移动操控任务中平均成功率达到80%,相较于现有方法提升了3-4个百分点。