EMNLPOct, 2023
ROME:评估预训练的视觉 - 语言模型在超越视觉常识推理上的表现
ROME: Evaluating Pre-trained Vision-Language Models on Reasoning beyond Visual Common Sense
Kankan Zhou, Eason Lai, Wei Bin Au Yeong, Kyriakos Mouratidis, Jing Jiang
TL;DR评估最新的预训练视觉 - 语言模型在解释反直觉情境方面的推理能力,揭示大多数模型在此方面仍然相当无能。