Sep, 2024

大型视觉语言模型的统一幻觉缓解框架

TL;DR本研究针对大型视觉语言模型(LVLMs)长生成中的幻觉问题,提出了一种名为“Dentist”的统一框架,以有效缓解幻觉。通过分类查询并基于分类结果执行不同的缓解过程,该方法在简化部署中能够分类为感知或推理,有效提高了生成的准确性,实验证明在MMbench上获得了显著的性能提升。