May, 2024

MetaToken: 通过元分类检测图像描述中的虚构

TL;DR通过引入 MetaToken,该研究提出了一种轻量级二元分类器来在低成本下检测大规模视觉语言模型中的幻觉,揭示了之前研究中忽视的 LVLMs 幻觉的关键因素,并在四个最先进的 LVLM 上进行了评估,证明了该方法的有效性。