EMNLPNov, 2023

现实生活视频中回答反事实问题的数据集:ACQUIRED

TL;DR多模态反事实推理是人工智能系统中重要而具有挑战性的能力,为了克服数据集的限制,研究人员开发了 ACQUIRED 数据集,涵盖了一系列事件类型,综合了物理、社会和时间三个推理维度,可以全面评估模型的反事实能力。与最先进的语言模型和多模态模型相比,实验结果显示存在着显著的性能差距,这表明多模态反事实推理仍然是一个开放挑战,并且 ACQUIRED 是一个全面可靠的基准,可激发未来该方向的研究。