May, 2024

AttenCraft: 文本图像定制中基于注意力引导的多概念解耦

TL;DR使用 AttenCraft 方法,我们提出了一种基于注意力引导的多概念解缠方法,它使用了自注意力和交叉注意力图来生成精确的概念掩模,并在训练过程中应用于每个目标概念的交叉注意力激活,从而在图像对齐方面优于基线模型,并在文本对齐方面表现相当。