Oct, 2024
统一三元组级幻觉评估用于大型视觉-语言模型
Unified Triplet-Level Hallucination Evaluation for Large Vision-Language
Models
TL;DR本研究针对现有大型视觉-语言模型(LVLM)生成的幻觉内容,提出了一个统一框架来同时评估对象和关系幻觉。通过对LVLM响应中提取的三元组(对象、关系、对象)进行评估,发现关系幻觉问题比对象幻觉更为严重,强调了这一被忽视的重要问题,并提出了一种简单有效的训练无关方法,显著提高了模型的表现。