CVPRMar, 2024
SNIFFER: 可解释的跨语境误信息识别的多模态大型语言模型
SNIFFER: Multimodal Large Language Model for Explainable Out-of-Context Misinformation Detection
Peng Qi, Zehong Yan, Wynne Hsu, Mong Li Lee
TL;DRSNIFFER 是一种特别针对超文本误导检测和解释的新型多模态大型语言模型,通过在 InstructBLIP 上进行两阶段的指令调整,不仅能够检测文字和图像之间的不一致性,还可以利用外部知识进行上下文验证,实验证明 SNIFFER 的检测准确性超过了原始的 MLLM 超过 40%,并且在解释能力方面也优于最先进的方法。