Apr, 2024

超越类别:通过语言解释实现零样本情境识别

TL;DR通过引入 Language EXplainer (LEX) 方法,本文在 SWiG 数据集上验证了预训练的视觉语言模型在零样本场景理解和基于场景的情境识别方面的有效性和互操作性。