Oct, 2023
通用视觉分解器: 简化长时控制
Universal Visual Decomposer: Long-Horizon Manipulation Made Easy
TL;DR通过提出Universal Visual Decomposer (UVD)作为一种针对视觉长时程操作的通用任务分解器,该方法基于预训练的视觉表示,通过检测嵌入空间中的相位变化来发现子目标,并在零附加训练成本的情况下在标准视觉运动策略训练上有效提取视频中的视觉子目标,进而在未知任务上展示了显著的组合泛化性能,并且可以用于构建基于目标的奖励塑形以加速强化学习中的时间扩展探索。