Oct, 2023

RoboCLIP:一个演示足够学会机器人策略

TL;DRRoboCLIP 是一种在线模仿学习方法,通过使用单个示例(视频演示或任务的文本描述)来生成奖励,克服了对大量领域内专家演示的需求,并且还能利用领域外的示例来生成奖励,无需手动设计奖励函数。使用 RoboCLIP 奖励进行训练的强化学习代理在下游机器人操作任务上表现出 2-3 倍的零 - shot 性能,仅使用一个视频 / 文本示例。