Jan, 2025
TREAD:高效的架构无关扩散训练的令牌路由
TREAD: Token Routing for Efficient Architecture-agnostic Diffusion
Training
TL;DR本研究解决了扩散模型在样本效率和高训练成本方面的不足,特别是在标准扩散变换器架构中的二次复杂性问题。通过采用预定义的路由机制有效地存储令牌信息并在更深层次重新引入,本文提出了一种无需架构修改的高效训练方法,结果在ImageNet-1K标准基准测试中显著降低了计算成本,提升了模型性能,实现了比现有最佳方法高出9.55倍的收敛加速。