ACLMay, 2022

训练模型对视觉常识知识的学习

TL;DR研究利用多模态模型来学习语言的局限性,提出了两个评估任务来衡量语言模型在视觉常识知识方面的表现。结果发现,基于视觉文本数据的多模态模型和单模态模型在视觉常识知识方面表现不显著不同。