使用 DDPM 反演和语义指导的实际图像编辑 LEDITS

Jul, 2023

使用 DDPM 反演和语义指导的实际图像编辑 LEDITS

LEDITS: Real Image Editing with DDPM Inversion and Semantic Guidance

Linoy Tsaban, Apolinário Passos

TL;DRLEDITS 是一种轻量级的图像编辑方法，结合了 Edit Friendly DDPM 反演技术和语义引导，能够实现对真实图像的细微和广泛编辑，而无需优化和扩展架构。

Abstract

Recent large-scale text-guided diffusion models provide powerful image-generation capabilities. Currently, a significant effort is given to enable the modification of these images using text only as means to offe

text-guided diffusion models image-generation editing inversion technique semantic guidance

发现论文，激发创造

LEDITS++：利用文本 - 图像模型进行无限图像编辑

文本到图像扩散模型对于仅使用文本输入产生高保真度图像的惊人能力近来引起了 increasing interest。然而，现有的图像到图像方法常常低效、不精确且使用范围有限。为了解决这些问题，我们介绍了一种高效且多用途的精确文本图像操作技术 LEDITS++。

Nov, 2023

无需反转的图像编辑与自然语言

对于扩散模型，尽管反演性编辑取得了一定进展，但基于文本的图像编辑仍面临困难。本研究提出了一种无需显式反演的编辑方法（InfEdit），通过引入特殊方差调度和统一的注意力控制机制，实现了对图像的稳定编辑和真实还原，且在各种编辑任务中表现出强大的性能和快速的实时应用潜力。

Dec, 2023

使用引导扩散模型编辑真实图像的无文本倒置技术

本文介绍了一种精确的图片逆向生成技术，实现了基于文本的图片编辑，通过引入 Pivotal inversion 和 NULL-text optimization 技术，以条件嵌入为导向，避免了模型权重的繁琐调整，并在真实照片上进行了高保真度编辑。

Nov, 2022

IterInv：逐步反演像素级 T2I 模型

大规模文本 - 图像扩散模型是生成根据输入文本提示的令人信服的图像的突破性发展。图像编辑研究的目标是通过修改文本提示来使用户对生成的图像具有控制能力。在这种情况下，迭代反转（IterInv）技术结合了流行的图像编辑方法，证明了 IterInv 的应用前景。

Oct, 2023

零样本无监督的基于文本的音频编辑使用 DDPM 逆转

使用预训练的大型模型以零样本方式编辑信号已在图像领域取得快速发展，而这一浪潮尚未触及音频领域。本文探讨了两种用于音频信号的零样本编辑技术，利用预训练扩散模型上的 DDPM 反演。第一种技术从图像领域引入，允许基于文本进行编辑。第二种方法是一种无监督发现语义有意义的编辑方向的新方法。将其应用于音乐信号时，该方法展示出一系列在音乐上有趣的修改，从控制特定乐器的参与到对旋律的即兴演奏。示例可在本文的示例页面（https URL）上找到，代码可在这个 https URL 找到。

Feb, 2024

使用扩散模型进行文本驱动图像编辑的 Prompt Tuning Inversion

本文提出了一种基于 Prompt Tuning Inversion 的精确快速反演技术，用于文本驱动的图像编辑，能够在保留输入图像高准确度的同时进行灵活的编辑，实验证明该方法在 ImageNet 数据集上的表现优于现有技术。

May, 2023

直接反演：使用 3 行代码提升基于扩散的编辑

文本引导扩散模型通过分离源图像和目标扩散分支，实现图像编辑的内容保留和编辑保真度优化，通过三行代码实现的直接反演技术在编辑基准测试中表现出卓越的性能和极大的加速。

Oct, 2023

BARET：基于平衡关注的实图像编辑引导目标文本逆转

通过目标文本翻译方案、渐进式过渡方案和平衡关注模块，我们提出了一种新的图像编辑技术，实现了包括非刚性编辑在内的各种编辑类型，并提高了图像编辑的效率和准确性。

Dec, 2023

iEdit: 弱监督下的本地化文本指导图像编辑

提出了一种新的学习方法 iEdit，用于文本引导的图像编辑，包括数据集的自动构建、无监督损失函数和分割掩模引导编辑。该模型在 200K 个样本的数据集上进行训练，并在图像保真度、CLIP 对齐性得分和编辑生成和真实图像方面显示出优越的结果。

May, 2023

Pix2Pix-OnTheFly：借助 LLMs 实现指导图像编辑

该研究论文通过语言处理和图像处理的组合吸引了越来越多的关注，其中一项最具挑战性的任务是仅基于自然语言指令对图像进行编辑。本论文提出了一种无需准备的方法，通过图像字幕和 DDIM 反演、获取编辑方向嵌入以及图像编辑等三个步骤有效地进行指令引导的图像编辑，该方法在 MAGICBRUSH 数据集上表现出色，优于最新的先进模型。

Mar, 2024