Aug, 2024

ConVis:对比解码与幻觉可视化以减轻多模态大型语言模型中的幻觉

TL;DR本文针对多模态大型语言模型中的幻觉问题,提出了一种名为ConVis的新型无训练对比解码方法。通过利用文本生成图像模型,从幻觉字幕中语义重构图像,ConVis有效地减少了幻觉现象,提高了模型的可靠性,展示了其在多种基准测试上的优异表现。