Nov, 2023

HiDiffusion: 解锁低分辨率训练扩散模型中的高分辨率创造力和效率

TL;DR我们引入了 HiDiffusion,一个无需调参的框架,由 Resolution-Aware U-Net(RAU-Net)和 Modified Shifted Window Multi-head Self-Attention(MSW-MSA)组成,可以使预训练大型文本到图像扩散模型能够高效生成超越训练图像分辨率的高分辨率图像(例如 1024×1024),并且能够以 40%-60%的推理时间缩短,实现高分辨率图像合成的最新性能。