Apr, 2023

DiffFit: 通过简单的参数高效调整解锁大规模扩散模型的可传递性

TL;DR该论文提出DiffFit,一种参数高效的策略,可以对大规模预先训练的扩散模型进行微调,从而实现对新领域的快速适应,本方法只需要微调特定层中的偏差项和新加入的缩放因子,相对于完整的微调,实现了2倍的训练加速和极低的模型存储成本,DiffFit在8个下游数据集中表现突出,取得了竞争性的性能,并证实缩放因子对快速适应的功效。