Oct, 2024

RecoveryChaining:学习本地恢复策略以实现稳健操作

TL;DR本研究针对现有模型在复杂操作中的失效问题,提出了一种新颖的层次强化学习方法,旨在学习独立的恢复策略。当检测到失败时,该策略可以使机器人恢复至可完成任务的状态。研究结果表明,相比于基线方法,该方法在学习恢复策略方面显著提高了鲁棒性,并成功实现了从仿真到物理机器人的转移。