Oct, 2023

大型视觉语言模型中的对象幻觉分析与缓解

TL;DRLVLM Hallucination Revisor (LURE)是一种简单而强大的算法,通过重建较少产生幻觉的描述来修正LVLMs中的物体幻觉问题,从而提高视觉总结和推理等视觉语言任务的性能。