May, 2024

通过提示混合实现扩散模型修补

TL;DRDiffusion Model Patching (DMP) 是一种简单的方法,通过在模型的输入空间中插入一小组可学习的提示来提升已经达到收敛状态的预训练扩散模型的性能,而不会显著增加参数。该方法通过一种动态门控机制(称为“mixture-of-prompts”),在生成过程的每个步骤中选择并组合一子集的可学习提示,充分发挥每个提示的独特专长,从而在每个步骤中“修补”模型的功能。实验证明,DMP显著提升了在FFHQ 256x256数据集上DiT-L/2模型的达到收敛状态的FID(Fréchet Inception Distance)指标,仅增加了1.43%的参数和5万次额外的训练迭代。