Mar, 2024

基于去噪任务难度的浸润模型训练的课程学习

TL;DR通过对任务困难度、收敛行为和概率分布间相对熵的变化进行综合观察,我们发现较早的时间步骤的去噪任务存在收敛缓慢和相对熵高的挑战,因此我们提出了一个易难混合的学习方案,借鉴了课程学习的思想,在训练过程中将时间步骤或噪声水平划分为难度递减的簇,并按顺序进行模型训练,以从易到难进行去噪任务,从而改变了同时跨越所有时间步骤训练扩散模型的传统方法。我们的方法通过利用课程学习的好处,提高了性能和收敛速度,并与扩散训练技术的现有改进保持正交性。我们通过在无条件生成、类条件生成和文本转图像生成等图像生成任务上的全面实验证实了这些优势。