Jun, 2024

MFC-Bench: 基于大型视觉 - 语言模型的多模态事实核查基准测试

TL;DR通过评估 MFC-Bench 对 12 个各异而代表性的大型视觉 - 语言模型进行了基准测试,发现当前模型在多模态事实核查方面仍存在不足,并对各种形式的操纵内容表现出麻木,希望通过 MFC-Bench 能够引起对未来可能由大型视觉 - 语言模型辅助的可信人工智能的关注。