May, 2024

通过混合掩膜信息融合提升文本到图像编辑

TL;DR基于扩散模型,本文旨在系统性地改进文本引导的图像编辑技术,以解决其局限性,通过在模型的自注意机制中引入人为注释来限制编辑范围,并将编辑后的图像与源图像和构建的中间图像进行融合,实验证明所提出的 ``MaSaFusion'' 显著提高了现有的文本到图像编辑技术。