Nov, 2024
面向物体中心的逆向策略恢复框架:视觉运动模仿学习中的分布外恢复
Out-of-Distribution Recovery with Object-Centric Keypoint Inverse Policy
For Visuomotor Imitation Learning
TL;DR本研究针对视觉运动策略学习中的分布外(OOD)场景挑战提出了一种物体中心的恢复策略框架。与以往依赖大量标注数据的行为克隆方法不同,我们的方法通过从原始训练数据中推断物体关键点流形梯度构建逆向策略来学习恢复策略,从而无需额外数据收集。这一恢复策略可以作为任何基于视觉运动行为克隆的基础策略的简单附加部分,引导系统重新回到训练分布,即使在OOD情境下也能确保任务成功。