May, 2024

自然语言有助于缩小 Sim2Real 鸿沟

TL;DR通过使用自然语言描述图像作为统一的信号来捕捉底层的任务相关语义,我们提出了一种方法来解决在学习图像条件机器人策略时所面临的模拟与真实世界之间的视觉差距问题,该方法通过对大量模拟数据和少量真实演示进行同时训练,将图像编码器作为无域变迁的图像表示的基础,并取得了较之前的 Sim2Real 方法和 CLIP、R3M 等强大的视觉 - 语言预训练方法 25 至 40% 的性能提升。