BRAT：架构无关的文本反转的奖励正交令牌

Aug, 2024

BRAT：架构无关的文本反转的奖励正交令牌

BRAT: Bonus oRthogonAl Token for Architecture Agnostic Textual Inversion

James Baker

TL;DR本研究解决了文本反转在使用非UNet架构时的不足，提出了一种基于视觉转换器的优化方法。通过引入奖励令牌并强制正交性，研究发现这种方法显著提升了模型对源图像的遵循度和对提示的响应度。此工作为文本反转技术的应用提供了新的思路和方法。

Abstract

Textual Inversion remains a popular method for personalizing Diffusion Models, in order to teach models new subjects and styles. We note that Tex

发现论文，激发创造

使用引导扩散模型编辑真实图像的无文本倒置技术

本文介绍了一种精确的图片逆向生成技术，实现了基于文本的图片编辑，通过引入Pivotal inversion和NULL-text optimization技术，以条件嵌入为导向，避免了模型权重的繁琐调整，并在真实照片上进行了高保真度编辑。

Nov, 2022

$P+$:文本到图像生成中的扩展文本调节

引入一种名为 $P+$ 的扩展文本条件空间，能够在文本到图像模型中提供更好的脱耦和控制，从而更好地实现图像合成和个性化文本到图像的模型。

Mar, 2023

无梯度文本反演

本文提出了一种基于进化策略的梯度自由框架，用于优化文本反演的过程，试图解决个性化文本生成中因梯度下降算法的内存消耗大、部署复杂等问题。实验结果表明，采用该方法生成的文本图像与采用梯度下降方法生成的相比，性能几乎没有损失，但能够获得更高的计算效率和更广泛的适用性。

Apr, 2023

使用扩散模型进行文本驱动图像编辑的Prompt Tuning Inversion

本文提出了一种基于Prompt Tuning Inversion的精确快速反演技术，用于文本驱动的图像编辑，能够在保留输入图像高准确度的同时进行灵活的编辑，实验证明该方法在ImageNet数据集上的表现优于现有技术。

May, 2023

一张图片胜过千言万语：用于受限文本到图像合成的多属性逆转

本文研究了使用用户提供的参考图像约束扩散模型输出的问题，旨在从单个参考图像中提取多个属性，并使用这些属性生成新的样本。首先，文中分析了在去噪过程的时间步维度和DDPM模型层维度中捕获的属性，并发现某些属性在相同的模型层和时间步骤中被捕获。基于这些发现，文中设计了一种新的多属性逆向算法MATTE，可以明确分离四个属性（颜色、风格、布局和物体）。

Nov, 2023

扩散模型模块定制的正交适应

通过引入正交适应方法，我们解决了一个名为模块化定制的新问题，旨在高效合并独立为个别概念进行微调的定制模型，从而在一幅图像中联合合成概念，同时保持保真度且不增加计算开销，这一方法在效率和身份保持方面始终优于相关基线。

Dec, 2023

稳定扩散模型的组合逆转

通过引入核心分布和空间正则化方法，我们的研究提出一种针对合成嵌入图像中过拟合问题的反转过程指导方法，使生成的图像中的概念更加多元和均衡。

Dec, 2023

提示硬或几乎不提示：用于文本到图像扩散模型的Prompt反转

通过使生成的图像内容与用户意图一致的提示，该方法利用扩散模型进行串行优化得到直观的语言提示，从而产生具有相似内容的多样化图像。

Dec, 2023

文本到图像扩散模型的固定点反演

通过固定点迭代的方法解决了扭曲反演的技术性挑战，设计了用于图像生成和处理的基于文本引导的扩散模型，并通过提示感知的编码调整改进了反演质量，最终在多个下游任务中取得了显著的改进。

Dec, 2023

仲裁者可参与：通过模型反演进行条件生成的替代方法

通过优化传统的采样过程，基于视觉语言模型的训练无生成模型可以实现更好的文本-图像对齐。结合Score Distillation Sampling模块，我们的方法可以生成高质量的图像。

Feb, 2024