Nov, 2022

基于视觉语言模型的指令增强机器人技能习得

TL;DR本论文介绍了一种名为 DIAL 的方法,利用半监督的语言标签,结合 CLIP 的语义理解,将知识传播到大型未标记的数据集中,并在增强的数据集上训练语言条件下的策略,从而使模仿学习策略获得新的能力并推广到原始数据集中未见过的 60 个新指令。