Apr, 2024

ViViDex: 从人类视频中学习基于视觉的灵巧操纵

TL;DR我们的研究旨在通过学习一种统一的基于视觉的策略,使多指机械手能够在各种姿势下操纵不同的物体。我们提出了一种新的框架 ViViDex,通过使用强化学习和轨迹引导奖励训练每个视频的基于状态的策略,从而获得视觉自然且物理可行的轨迹,并在不使用任何特权信息的情况下训练出一个统一的视觉策略,该方法通过坐标转换方法显著提升了性能,在三个灵巧操纵任务上展示出了较大的改进。