Mar, 2024

稳定传播中文本引导图像编辑中跨域与自注意力的理解

TL;DR通过对 Stable Diffusion 模型进行深入分析,发现交叉注意力映射中的对象归属信息容易导致编辑失败,而自我注意力映射在源图像到目标图像的转换过程中起到了关键保留几何和形状细节的作用。在此基础上,我们提出了一种更简化、更稳定、更高效的无需调整的图像编辑方法,仅在去噪过程中修改指定注意力层的自我注意力映射。实验结果表明,我们的简化方法在多个数据集上始终优于流行方法的性能。