Oct, 2024
扩散模型需要视觉先验进行图像生成
Diffusion Models Need Visual Priors for Image Generation
TL;DR本研究解决了传统类引导扩散模型在细节纹理生成上的不足,指出依赖粗略的类先验信息限制了模型性能。提出的“扩散上的扩散”(DoD)框架通过从先前生成的样本中提取视觉先验,提供丰富的引导信息,显著降低训练成本,同时提升生成图像的质量和细节。研究结果表明,DoD-XL模型在有限的训练步骤下,获得的FID-50K评分显著优于其他最先进的方法。