May, 2024
U-DiTs:在 U 形扩散变压器中降采样 Token
U-DiTs: Downsample Tokens in U-Shaped Diffusion Transformers
Yuchuan Tian, Zhijun Tu, Hanting Chen, Jie Hu, Chao Xu...
TL;DR将变换器架构引入扩散任务,对潜在空间图像生成进行了研究,发现 U-Net 架构只在 U-Net 归纳偏差中略有优势,提出了 U 型扩散变换器(U-DiT)模型,通过降低计算量并在自注意力中进行令牌下采样,在性能上超过了 DiT-XL/2。