Jun, 2023

A-STAR: 文本到图像合成的测试时间注意力分离和保留

TL;DR本文提出了两种测试时间注意力损失函数,显著提高了预训练的基线文本到图像扩散模型的性能。第一,注意力隔离损失减少了文本提示中不同概念的注意力图之间的交叉重叠,从而减少了各种概念间的混淆 / 冲突和在生成的输出中捕获所有概念的最终目标。接下来,我们的注意力保留损失明确强制文本到图像扩散模型在整个去噪时间步中保留所有概念的交叉注意力信息,从而减少信息丢失并保留生成输出中的所有概念。