Mar, 2024

反思后比较策略减轻视觉错觉

TL;DR通过提出 Pensieve 方法,研究发现多模态大语言模型在处理视觉幻觉时会同时支持准确和不存在的内容,Pensieve 方法通过在推理中回溯相关图像作为参考,并将其与测试图像进行比较,从而减少视觉幻觉现象,并提升图像描述的细节和特定性。