Nov, 2024
以对象为中心的逆策略恢复框架用于视觉运动模仿学习中的分布外恢复
Out-of-Distribution Recovery with Object-Centric Keypoint Inverse Policy
For Visuomotor Imitation Learning
TL;DR本研究解决了视觉运动策略学习中分布外(OOD)场景的挑战,提出了一种以对象为中心的恢复策略框架。通过从原始训练数据中的对象关键点流形梯度推导逆策略,该方法能够在没有额外数据的情况下学习恢复策略,增强了传统行为克隆方法在OOD情境下的任务成功率,实验显示其相较于基线策略提升了77.7%。