Mar, 2023

视觉语言模型作为成功检测器

TL;DR本文介绍了一种使用大型预训练视觉语言模型和人工奖励注释的成功检测方法,将其作为视觉问答问题,研究了在三个不同领域的成功检测和推广属性,证明该方法能在看到未知语言和视觉变化的情况下胜过定制奖励模型。