EMNLPOct, 2023

ROME:评估预训练的视觉 - 语言模型在超越视觉常识推理上的表现

TL;DR评估最新的预训练视觉 - 语言模型在解释反直觉情境方面的推理能力,揭示大多数模型在此方面仍然相当无能。