Mar, 2024

InstructBrush:基于注意力机制的图像编辑指令优化学习

TL;DR基于图像编辑指令的方法近年来在图像编辑中受到重视。然而,尽管这些方法包含了广泛的编辑先验知识,但在处理通过语言难以准确描述的编辑任务时却无能为力。我们提出了一种名为 InstructBrush 的反演方法,用于解决这个问题。该方法从示例图像对中提取编辑效果作为编辑指令,进而用于图像编辑。通过引入注意力机制的编辑指令优化和以转换为导向的编辑指令初始化两项关键技术,InstructBrush 解决了以往方法在反演效果和指令泛化方面的局限性。为了探索指令反演方法在开放场景中指导图像编辑的能力,我们建立了一个以转换为导向的配对基准 (TOP-Bench),其中包含丰富的场景和编辑类型。这个基准的创建为进一步探索指令反演铺平了道路。定量和定性分析表明,我们的方法在编辑方面取得了更优异的性能,并且在语义上更符合目标编辑效果。