Aug, 2023

揭示扩散模型中的暴露偏差

TL;DR扩散模型具有令人印象深刻的生成能力,但其所谓的 “曝光偏差” 问题,即训练和抽样之间的输入不匹配,缺乏深入探索。本文通过首先对抽样分布进行分析建模,然后将每个抽样步骤的预测误差归因为曝光偏差问题的根本原因,对扩散模型中的曝光偏差问题进行了系统研究。此外,我们讨论了此问题的潜在解决方案,并提出了一个直观的度量方法。除了阐明曝光偏差问题,我们还提出了一种简单但有效的无需训练的方法,称为 Epsilon Scaling,以缓解曝光偏差。我们通过缩小网络输出(Epsilon)使抽样轨迹明确地接近训练阶段学习到的向量场,减轻了训练和抽样之间的输入不匹配。针对各种扩散框架(ADM,DDPM/DDIM,LDM),无条件和有条件设置以及确定性与随机抽样的实验验证了我们方法的有效性。