CVPRMar, 2024

SNIFFER: 可解释的跨语境误信息识别的多模态大型语言模型

TL;DRSNIFFER 是一种特别针对超文本误导检测和解释的新型多模态大型语言模型,通过在 InstructBLIP 上进行两阶段的指令调整,不仅能够检测文字和图像之间的不一致性,还可以利用外部知识进行上下文验证,实验证明 SNIFFER 的检测准确性超过了原始的 MLLM 超过 40%,并且在解释能力方面也优于最先进的方法。