May, 2023
利用弱监督进行预处理的视觉语言推理
Preconditioned Visual Language Inference with Weak Supervision
Ehsan Qasemi, Amani R. Maina-Kilaas, Devadutta Dash, Khalid Alsaggaf, Muhao Chen
TL;DR本文提出了预先条件的视觉语言推理与理性化(PVLIR)的任务,研究表明 SOTA 的 VLM 模型无法提取出这种先决条件,提出了三种策略来提取弱监督信号,并开发了经过人工验证的测试集进行评估。