May, 2024

基于文本模态的图像特征提取用于检测基于扩散的深度伪造

TL;DR通过传统图像编码器提取的特征分析发现,无论是低级特征还是高级特征都对于识别不同扩散方法制作的 DeepFake 图像具有独特的优势。受到这一发现的启发,我们旨在开发一种有效的表示方法,以捕捉低级和高级特征来检测基于扩散的 DeepFakes。为了解决这个问题,我们提出了一种文本模态导向的特征提取方法,称为 TOFE。具体而言,对于给定的目标图像,我们发现的表示是一个相应的文本嵌入,可引导具有特定文本到图像模型的目标图像生成。在十种扩散类型的实验中证明了我们提出的方法的功效。