Mar, 2025

TruthPrInt:通过潜在真实引导预干预缓解大型视觉语言模型的对象幻觉

TL;DR本文研究了大型视觉语言模型(LVLM)中的对象幻觉问题,提出了一种新的解决方案——真实引导预干预(TruthPrInt)。研究发现,LVLM的内部状态可以作为幻觉行为的具体指示器,并且不同的LVLM在潜在子空间中表现出共通的幻觉模式,这为缓解对象幻觉提供了新的思路。实验结果表明,TruthPrInt在多个基准测试中显著超越了现有最先进的方法。