Sep, 2024

站在巨人的肩膀上:重编视觉-语言模型进行通用深度伪造检测

TL;DR本研究针对现有深度伪造检测方法在未见数据集和新兴生成模型上泛化能力不足的问题,提出了一种新颖的方法,利用视觉-语言模型(VLM)的零-shot优势,实现通用深度伪造检测。通过简单操控输入而不调整内部参数,本方法显著提高了跨数据集和跨操控的深度伪造检测性能,具有良好的实际应用潜力。