Feb, 2025
通过注意力校准减缓大型视觉-语言模型中的对象幻觉
Mitigating Object Hallucinations in Large Vision-Language Models via
Attention Calibration
TL;DR本研究针对大型视觉-语言模型(LVLMs)在多模态推理中出现对象幻觉的问题,提出了一种新颖的解决方案。通过提出统一注意力校准(UAC)和动态注意力校准(DAC)方法,研究显示这些方法能有效减轻幻觉现象并提高多模态对齐的准确性,对不同LVLM架构的表现都达到了最先进的水平。