Jun, 2024

AUTOHALLUSION:视觉语言模型的自动生成幻觉基准

TL;DR大型视觉 - 语言模型存在幻觉问题,该研究开发了自动生成幻觉的基准测试方法 AUTOHALLUSION,通过识别上下文线索并以此生成图像和问题,揭示了幻觉的常见失败模式和原因。对顶级视觉 - 语言模型进行综合评估发现,在 AUTOHALLUSION 的合成和真实世界数据集上,幻觉诱导成功率达到了 97.7% 和 98.7%,为解决幻觉问题提供了新的思路。