Dec, 2022

扩散艺术还是数码伪造? 探究扩散模型中数据复制

TL;DR本文研究了图像检索框架,让我们能够比较生成的图像与训练样本,并检测什么时候复制了内容。我们使用这个框架分析了多个数据集上训练的扩散模型,包括牛津花卉,Celeb-A,ImageNet和LAION,讨论了训练集大小等因素对内容复制率的影响。同时,我们还发现了一些这种扩散模型直接从其训练数据中复制的情况,包括流行的稳定扩散模型。