Nov, 2023

关于扩散模型在合成训练数据集中的限制

TL;DR通过分析真实样本复制过程中通过扩散和反向过程重建的合成样本,我们发现现代扩散模型不能完美地代表数据分布以用于训练鉴别性任务,这意味着合成数据集在分类性能上不如真实数据集。我们的研究结果表明,合成数据在增加反向步骤时集中于训练数据分布的模式,难以覆盖分布的外边缘,因此现代扩散模型在复制训练数据分布方面还有改进的空间。