May, 2024

U-DiTs:在 U 形扩散变压器中降采样 Token

TL;DR将变换器架构引入扩散任务,对潜在空间图像生成进行了研究,发现 U-Net 架构只在 U-Net 归纳偏差中略有优势,提出了 U 型扩散变换器(U-DiT)模型,通过降低计算量并在自注意力中进行令牌下采样,在性能上超过了 DiT-XL/2。