Jan, 2024

固定点扩散模型

TL;DR我们介绍了一种新颖的方法 ——Fixed Point Diffusion Model(FPDM),它将固定点求解的概念融入了基于扩散的生成模型框架中。通过将隐式固定点求解层嵌入到扩散模型的去噪网络中,我们的方法将扩散过程转化为一系列紧密相关的固定点问题。结合新的随机训练方法,这种方法显著减小了模型大小,降低了内存使用量,并加快了训练速度。此外,它还提供了两种新技术来提高采样效率:在时间步长之间重新分配计算和重用固定点解。我们在 ImageNet、FFHQ、CelebA-HQ 和 LSUN-Church 上进行了大量实验,证明了性能和效率的显著改进。与最先进的 DiT 模型相比,FPDM 的参数数量减少了 87%,训练过程中的内存消耗减少了 60%,并且在采样计算或时间有限的情况下提高了图像生成质量。我们的代码和预训练模型可以在此 https URL 中获得。