Jun, 2024

以自身的错误版本引导扩散模型

TL;DR使用自身较小、较少训练的模型而不是无条件模型,引导生成图像,可以获得图像质量分离的控制,同时不减少变化量。这在 ImageNet 生成方面有显著的改进,64x64 像素的 FID 为 1.01,512x512 像素的 FID 为 1.25,使用公开可用的网络。此方法还适用于无条件扩散模型,大幅提高它们的质量。