CVPRMar, 2024

使用潜在扩散模型和隐式神经解码器进行任意尺度图像生成和上采样

TL;DR提出了一个新的方法来实现输入图像的超分辨率或从随机噪声生成任意比例的新图像,该方法通过预训练的自动编码器、隐式扩散模型和隐式神经解码器及其学习策略组成。该方法在潜空间中采用扩散过程,与 MLP 在任意比例上的解码器空间相一致,并通过固定解码器反向传播输出图像的错误,提高了输出图像的质量。在广泛的实验中,该方法在图像质量、多样性和尺度一致性等指标方面均优于相关方法,在推理速度和内存使用方面显著优于相关的最新技术。