May, 2023

评估大规模视觉语言模型中的物体错构

TL;DR通过对大型视觉语言模型的系统研究,本论文发现大型视觉语言模型容易出现物体幻影问题,并探讨了视觉指导对幻觉的影响,提出了一种改进的评估方法POPE,以更稳定和灵活的方式评估物体幻影问题。