PatchScaler:一种高效的与补丁无关的扩散模型用于超分辨率
提出了一种基于自注意机制的无卷积操作的转化器和生成对抗网络(GAN)网络 —— 补丁翻译器用于图像超分辨率,实验证明该网络在超分辨率上的性能得到了显著提升。
Oct, 2023
提出了一种名为 Patch Diffusion 的通用 Patch-wise 训练框架,其核心创新是新的条件分数函数,它在原始图像的 Patch 级别包括 Patch 位置作为附加坐标通道,并且通过训练在多个尺度上对 Patch 大小进行随机和多样化,从而达到显著减少训练时间成本同时提高数据效率以帮助更广泛的用户学习扩散模型。
Apr, 2023
我们提出了一种有效的去噪扩散模型,用于生成高分辨率图像 (例如 1024x512),该模型是在小尺寸图像块 (例如 64x64) 上训练的。我们的算法名为 Patch-DM,其中设计了一种新的特征拼贴策略,以避免合成大尺寸图像时的边界伪影。通过特征拼贴,我们可以系统地裁剪并组合相邻图像块的部分特征来预测移位图像块的特征,从而在图像块特征空间中的重叠区域中实现整个图像的无缝生成。Patch-DM 在我们新收集的自然图像数据集 (1024x512) 以及标准基准较小尺寸 (256x256) 上产生了高质量的图像合成结果,包括 LSUN-Bedroom、LSUN-Church 和 FFHQ。我们将我们的方法与以前的基于图像块的生成方法进行了比较,并在所有四个数据集上获得了最先进的 FID 分数。此外,与经典的扩散模型相比,Patch-DM 还减少了内存复杂度。
Aug, 2023
本文提出了一种新颖的自级联扩散模型,通过利用低分辨率模型的丰富知识快速适应高分辨率图像和视频生成,使用无需调优或廉价上采样器调优范例。该自级联扩散模型整合了一系列多尺度上采样器模块,可以有效地适应更高的分辨率,保持原始组合和生成能力。我们进一步提出了一种基于中心引导的噪声重新调度策略,以加快推理过程并提高局部结构细节。与完全微调相比,我们的方法在训练速度上提高了 5 倍,并且仅需要额外的 0.002M 调优参数。广泛的实验表明,我们的方法可以通过仅仅进行 10k 步的微调,快速适应更高分辨率的图像和视频合成,几乎不需要额外的推理时间。
Feb, 2024
本文提出了一种通过仅对图像的补丁进行扩散模型训练来学习整个图像的高效数据先验的方法,该方法通过分数和位置编码获取整个图像的分数函数,并将其用作解决逆问题的先验。该方法在提高内存效率和数据效率的同时,仍然能够通过位置编码生成整个图像,并且可以与不同的扩散逆求解器(DIS)配合使用,适用于自然和医学图像域中的各种逆问题解决,包括 CT 重建,去模糊和超分辨率,仅使用基于补丁的先验方法优于基于整个图像先验训练的先前 DIS 方法在训练数据有限的情况下表现出了数据效率。
Jun, 2024
扩散模型在图像和视频合成方面表现出了卓越的性能,但将其扩展到高分辨率输入是具有挑战性的,并且需要将扩散流程重组为多个独立组件,限制了可伸缩性并复杂化了下游应用。
Jun, 2024
本文提出了基于自适应补丁退出(APE)的可伸缩方法来实现更实际的加速。我们首先建议训练回归器来预测各个层的增量容量,一旦增量容量低于阈值,特定层上的补丁可以退出。此外,我们提出了一种新的策略来实现网络训练。通过不同的阈值设置,我们的方法可以轻松调整性能和效率的折衷。在各种主干,数据集和缩放因子上进行了广泛的实验证明了我们方法的优点。
Mar, 2022
为解决扩散图像超分辨率方法的低推理速度和性能下降问题,我们提出了一种新颖和高效的扩散模型,通过减少扩散步骤的数量,消除了推理过程中的加速要求以及性能恶化,并通过在高分辨率图像和低分辨率图像之间转移残差来显著提高转换效率。实验显示,该方法在合成和真实数据集上均能获得优秀或至少相当于当前最先进方法的性能,即使只使用 15 个采样步骤。
Jul, 2023
本文介绍了一种新的方法,利用预先训练的文本到图像扩散模型中所包含的先前知识来实现盲超分辨率,并通过引入可控特征包装模块和渐进聚合采样策略来克服扩散模型固定尺寸的限制,实现对任何大小分辨率的适应,并在综合评估中展示了该方法在超分辨率领域的优越性。
May, 2023
通过级联扩散控制模型和多重注意机制,本研究提出了一种图像超分辨率方法,其目标是从降质版本中生成高质量、清晰的图像。研究结果表明该方法在提高图像还原的准确性和真实性方面非常有效和优越。
Mar, 2024