缓存我如果你能：通过块缓存加速扩散模型

Dec, 2023

缓存我如果你能：通过块缓存加速扩散模型

Cache Me if You Can: Accelerating Diffusion Models through Block Caching

Felix Wimbauer, Bichen Wu, Edgar Schoenfeld, Xiaoliang Dai, Ji Hou...

TL;DR通过对网络层的行为研究，我们发现图像去噪网络中的许多层计算是多余的，基于此，引入块缓存以加快推理速度，并提出一种基于每个块变化的自动确定缓存调度的技术。在实验中，我们通过 FID、人工评估和定性分析展示了块缓存在保持相同计算成本的前提下生成具有更高视觉质量的图像。

Abstract

diffusion models have recently revolutionized the field of image synthesis due to their ability to generate photorealistic images. However, one of the major drawbacks of →

diffusion models image synthesis denoising network block caching visual quality

发现论文，激发创造

DeepCache：加速扩散模型的自由之选

Diffusion models have gained attention in image synthesis, and this paper introduces DeepCache, a training-free paradigm that accelerates diffusion models by capitalizing on temporal redundancy in denoising steps and achieving a speedup factor of 2.3x for Stable Diffusion v1.5 and 4.1x for LDM-4-G without significant decline in CLIP Score or FID on ImageNet.

Dec, 2023

学习缓存：通过层缓存加速扩散变压器

Diffusion Transformers 在缓存机制和学习缓存等方面具有高效的推理能力，优于传统的采样方法，具有多个主题和研究领域。

Jun, 2024

高效服务扩散模型的近似缓存

该研究论文介绍了一种名为近似缓存的技术，通过重用在先前图像生成中创建的中间噪声状态来减少迭代去噪步骤，从而降低基于提示的图像生成的计算和延迟，提供高品质图像生成的最优化解决方案。

Dec, 2023

时钟扩散：基于模型步骤提炼的高效生成

该研究旨在提高文本到图像扩散模型的效率，通过周期性地重复利用计算以近似低分辨率特征图，在保持感知分数可比拟或改善的同时，大大减少了计算复杂度。

Dec, 2023

超越 U：打造更快速、更轻量级的扩散模型

利用连续动力系统设计一种新型去噪网络，以提高扩散模型的参数效率、收敛速度和噪声鲁棒性。与基准模型相比，该模型具有约四分之一的参数量和百分之三十的浮点操作数（FLOPs），推理速度提高了 70％，并且收敛到了更好的质量解。

Oct, 2023

并非所有步骤相等：高效生成与渐进传播模型

提出了一种名为 Step-Adaptive Training 的创新训练策略，通过在初始阶段训练一个基础去噪模型来涵盖所有时间步长，然后将时间步长分成不同的组，在每个组内进行微调以实现专门的去噪能力，这种方法不仅提高了模型性能，还显著降低了计算成本。

Dec, 2023

扩散模型中通过初始图像编辑实现引导图像合成

通过稳定的扩散实验，我们发现初始图像中的像素块倾向于生成特定的内容，我们通过修改它们可以显著影响生成的图像，这种影响只影响特定的区域，而不影响其他区域，这对于重绘任务非常有用。我们发现像素块的生成偏好主要由其值而不是位置决定，通过将具有生成用户所需内容倾向的像素块移动到用户指定的区域，我们的方法在布局到图像生成方面实现了最先进的性能，我们的结果凸显了初始图像操作在控制生成图像方面的灵活性和能力。

May, 2023

使用潜在扩散模型进行高分辨率图像合成

通过在预训练的自编码器的潜在空间中应用扩散模型，引入交叉注意力层到模型体系结构中，以更少的计算要求取得接近最优的性能，实现高分辨率合成，缩小像素级 DMs 对计算资源的需求。

Dec, 2021

动态双输出扩散模型

在这篇文章中，我们发现了扩散模型生成质量受到迭代次数限制的根本原因，并提出了一个简单而有效的解决方案来缓解这些影响。我们的解决方案可以应用于任何现有的扩散模型，并且在各种 SOTA 体系结构上运行多个数据集和配置进行实验和详尽的消融研究，证明能够立即提高它们的生成质量。

Mar, 2022

高保真基于扩散的图像编辑

扩散模型在图像生成和编辑领域取得了显著的成功。我们提出了一种创新的框架，其中包含一个修正模块，用残差特征调节扩散模型权重，以填补编辑过程中准确性的差距。此外，我们引入了一种新的学习范式，旨在在编辑过程中最小化错误传播。通过大量实验证明，我们的提议框架和训练策略在各种去噪步骤下实现了高保真的重建和编辑结果，并在定量指标和质量评估方面表现出色。此外，我们还通过图像到图像的转换和跨领域图像编辑等多个应用探索了模型的泛化能力。

Dec, 2023