Nov, 2023

SeRO: 自我监督强化学习用于超出分布情况的恢复

TL;DR我们提出了一种新颖的方法,通过自我监督地训练,使机器人智能体能够在发生超出分布状态的情况下重新获得自身的状态分布,并大大提高了其从超出分布状态中恢复的能力。