Jan, 2025

去中心化扩散模型

TL;DR本文解决了大规模AI模型训练中对集中式高带宽网络的依赖,提出了一种去中心化扩散模型的框架,能在独立集群或数据中心中分布式训练扩散模型。研究表明,该方法显著降低基础设施成本,并提升了对局部GPU故障的抗击能力,同时在多个任务上超越了传统的扩散模型表现。