Oct, 2024

在回答之前仔细考虑:用于缓解多模态大型语言模型幻觉的记忆空间视觉重追

TL;DR本研究解决了多模态大型语言模型在面对视觉输入时产生幻觉的问题。我们提出了记忆空间视觉重追(MemVR),这一新颖的方法通过将视觉提示作为补充证据重新注入模型,显著减少了幻觉现象,且在各项基准测试中表现优异,显示了其广泛适用的潜力。