Sep, 2023

KV 翻转:文本依赖的真实图像动作编辑中的 KV 嵌入学习

TL;DR文本条件图像编辑是一个新出现的高度实用的任务,其潜力是无法衡量的。然而,大多数现有方法无法进行动作编辑,即它们无法产生与编辑提示的动作语义相符合且保留原始图像内容的结果。为了解决动作编辑问题,我们提出了 KV Inversion 方法,它可以实现令人满意的重建性能和动作编辑,可以解决两个重要问题:1)编辑结果能够匹配相应的动作,2)编辑对象能够保留原始真实图像的纹理和身份。此外,我们的方法不需要训练稳定弥散模型本身,也不需要扫描大规模数据集进行耗时的训练。