Dec, 2023

数据引导扩散模型的旅途

TL;DR通过扩散模型对大型数据集进行训练可以合成具有出色质量和多样性的照片级真实图像。然而,将这些图像归因于训练数据 - 即确定导致生成图像的具体训练示例 - 仍然是一项挑战。在本文中,我们提出了一个框架,(i)在扩散模型的上下文中提供了数据归因的形式概念,并(ii)允许我们反事实地验证这些归因。然后,我们提供了一种高效计算这些归因的方法。最后,我们将该方法应用于发现(和评估)在 CIFAR-10 上训练的去噪扩散概率模型及在 MS COCO 上训练的潜在扩散模型的这些归因。我们在这个 URL 提供了代码。