Sep, 2023

动态提示学习:解决文本为基础的图像编辑中的交叉注意力泄漏问题

TL;DR基于大规模的文本到图像生成模型,本研究针对图像编辑的问题,通过动态提示学习(DPL)方法修复交叉注意力图,实现对特定对象的精细图像编辑,防止对其他图像区域的意外更改。通过广泛的评估,DPL方法在多个指标上取得了卓越的结果,尤其是在复杂的多物体场景中进行的提示编辑,包括单词替换、提示改进和注意力重新加权。