Feb, 2025

改善自编码器的扩散性

TL;DR本研究解决了自编码器在潜在空间中高频成分的干扰问题,这影响了扩散合成过程的图像生成质量。通过引入尺度等变性作为一种正则化策略,研究显著提高了生成质量,在ImageNet-1K和Kinetics-700数据集上分别减少了19%和44%的FID与FVD指标。该方法仅需较少的代码改动和有限的微调步骤,具有较高的实用性。