Feb, 2024

逻辑闭环:在大规模视觉 - 语言模型中揭示物体幻觉

TL;DR利用逻辑封闭环路的原理,提出了一种基于逻辑一致性探测的对象幻觉检测和缓解框架,命名为 LogicCheckGPT,该方法可以无缝应用于所有现有的大视觉 - 语言模型,并在三个基准测试中的四种模型上进行的全面实验表明了该方法带来的显着改进,证明了其有效性和普适性。