May, 2023

利用弱监督进行预处理的视觉语言推理

TL;DR本文提出了预先条件的视觉语言推理与理性化(PVLIR)的任务,研究表明 SOTA 的 VLM 模型无法提取出这种先决条件,提出了三种策略来提取弱监督信号,并开发了经过人工验证的测试集进行评估。