Nov, 2022

通过知识图谜题提升视觉 - 语言模型的常识能力

TL;DR本文提出了一种名为 DANCE 的数据增强策略,使用知识图谱线性化技术向现有 VL 数据集中注入常识知识,从而提高 VL 模型的常识能力,并首次提出了基于检索的常识诊断基准进行细致实验验证。