噪声图引导：基于空间上下文的真实图像编辑反演

ICLRFeb, 2024

噪声图引导：基于空间上下文的真实图像编辑反演

Noise Map Guidance: Inversion with Spatial Context for Real Image Editing

Hansam Cho, Jonghyun Lee, Seoung Bum Kim, Tae-Hyun Oh, Yonghyun Jeong

TL;DR通过噪声地图引导的方式，我们提出了一种适用于真实图像编辑的反演方法，它具备空间上下文且无需优化，保持了良好的编辑质量。

Abstract

text-guided diffusion models have become a popular tool in image synthesis, known for producing high-quality and diverse images. However, their application to →

text-guided diffusion models image synthesis editing real images null-text inversion (nti)noise map guidance (nmg)

发现论文，激发创造

使用引导扩散模型编辑真实图像的无文本倒置技术

本文介绍了一种精确的图片逆向生成技术，实现了基于文本的图片编辑，通过引入 Pivotal inversion 和 NULL-text optimization 技术，以条件嵌入为导向，避免了模型权重的繁琐调整，并在真实照片上进行了高保真度编辑。

Nov, 2022

通过近端引导改进负倒装

本文提出了 ProxNPI 方法，通过将 NTI 和 NPI 的概念扩展为一种正则化术语和重建指导来优化 NPI，从而实现对真实图像进行编辑的任务，并在保持训练免费的同时降低了人工伪影。

Jun, 2023

基于小波引导的扩散图像编辑中的文本反转加速

通过使用 WaveOpt-Estimator 和 Negative-Prompt Inversion 等创新方法以及波形变换分析，本研究提出了一种在保持图像结构的同时加速图像编辑过程的方法，相对于传统 Null-text Inversion 方法平均编辑时间减少超过 80%，为基于扩散模型的高效、高质量图像编辑研究提供了有希望的方法。

Jan, 2024

ReNoise: 迭代噪声实现真实图像反转

最近，文本引导的扩散模型取得了强大的图像处理能力。然而，将这些方法应用于真实图像需要将图像反转到预训练的扩散模型的领域中。实现准确的反转仍然是一个挑战，特别是对于训练用于生成具有少量降噪步骤的图像的最新模型。在这项工作中，我们引入了一种具有高质量操作比的反转方法，提高重建准确性而不增加操作次数。我们的方法建立在扩散采样过程的反转基础之上，采用在每个反转采样步骤中进行迭代降噪的机制。该机制通过迭代应用预训练的扩散模型，并对这些预测进行平均，从而改善了沿前向扩散轨迹预测点的逼近性。我们使用各种采样算法和模型对我们的 RenNoise 技术的性能进行评估，并进行全面的评估和比较，展示了其在准确性和速度方面的有效性。此外，我们通过在真实图像上展示基于文本的图像编辑，证实了我们的方法的可编辑性。

Mar, 2024

负样本翻转：基于文本引导扩散模型的快速图像编辑

本文提出一种负激励反演方法，通过前向传播实现等效重建来加速处理图像编辑中的扩散模型，实验证明与现有方法相比，我们的方法的重建质量是可比的，更快，可用于改善扩散模型的重建质量。

May, 2023

无需反转的图像编辑与自然语言

对于扩散模型，尽管反演性编辑取得了一定进展，但基于文本的图像编辑仍面临困难。本研究提出了一种无需显式反演的编辑方法（InfEdit），通过引入特殊方差调度和统一的注意力控制机制，实现了对图像的稳定编辑和真实还原，且在各种编辑任务中表现出强大的性能和快速的实时应用潜力。

Dec, 2023

可编辑的 DDPM 噪声空间：反演和操作

该研究提出一种针对去噪扩散概率模型 (DDPM) 的替代性噪声空间，以便进行广泛的编辑操作，并介绍了一种反演方法，用于提取任何给定图像（真实或人工生成的）的适合进行编辑的噪声生成图。

Apr, 2023

使用 DDPM 反演和语义指导的实际图像编辑 LEDITS

LEDITS 是一种轻量级的图像编辑方法，结合了 Edit Friendly DDPM 反演技术和语义引导，能够实现对真实图像的细微和广泛编辑，而无需优化和扩展架构。

Jul, 2023

使用扩散模型进行文本驱动图像编辑的 Prompt Tuning Inversion

本文提出了一种基于 Prompt Tuning Inversion 的精确快速反演技术，用于文本驱动的图像编辑，能够在保留输入图像高准确度的同时进行灵活的编辑，实验证明该方法在 ImageNet 数据集上的表现优于现有技术。

May, 2023

优化噪声追求以增强文本到视频生成

通过使用基于扩散模型建立的噪声 - 视频映射，由搜索 - 反转流程逼近文本输入的最佳噪声，同时通过一个语义保持改写器来丰富文本提示，实现文本到视频模型的有效优化。

Nov, 2023