ICCVOct, 2023

如果电视关闭了会怎么样?研究多模态语言模型的反事实推理能力

TL;DR我们聚焦于多模态大型语言模型的反事实推理能力进行基准测试,并通过新收集的测试数据集评估了最新的视觉语言模型和代码生成 LLMs 的能力,发现目前存在较大的发展空间。