Jan, 2022
以Transformer桥接自我中心和第三人称视角,用于机器人操纵的深入研究
Look Closer: Bridging Egocentric and Third-Person Views with
Transformers for Robotic Manipulation
TL;DR本研究提出了一种基于视觉反馈的精细操作任务解决方案,结合第三人称相机和机器人手腕上的自我中心相机的可视化反馈,使用Transformers跨视图关注机制来有效融合两个视图的信息,并将其作为强化学习策略的输入。实验结果表明,该方法相对于基线(single-view, multi-view)有明显的学习优势,并能够成功地转移到具有不稳定摄像头、无状态信息和高任务变异度的实际机器人操作任务中。