Oct, 2024

FakeShield:基于多模态大语言模型的可解释图像伪造检测与定位

TL;DR本研究针对当前图像伪造检测与定位方法的黑箱性和通用性不足的问题,提出了可解释的图像伪造检测与定位任务,设计了FakeShield框架。该框架通过像素级和图像级的伪造线索,对图像真伪进行评估,并生成伪造区域的掩模,实验证明其在多种伪造技术的检测和定位上优于以往方法,具有显著的可解释性。