Jun, 2024

统一自编码与屏蔽扩散

TL;DR提出了一种统一的自监督目标(Unified Masked Diffusion),通过在单一的自编码框架中结合基于补丁和噪声的破坏技术,使用扩散变换器(DiT)培训过程中引入额外的无噪声、高掩膜表示步骤,并在后续时间步骤中使用混合的掩膜和噪声图像,以实现在下游生成和表示学习任务中强大的性能。