Mar, 2024

开关扩散变压器:用稀疏专家混合协同降噪任务

TL;DR通过引入 Switch Diffusion Transformer (Switch-DiT) 模型,建立冲突任务之间的相互关系,保留语义信息,同时通过稀疏专家集合在每个转换器块中的参数隔离,实现了改进扩散模型架构的目标。通过实验证实了该方法在提高图像质量和收敛速度方面的有效性,并进一步分析表明 Switch-DiT 模型可以根据不同的生成场景构建定制的降噪路径。