Apr, 2024

文本到图像生成中的对象 - 属性绑定:评估与控制

TL;DR通过提出聚焦交叉注意力(FCA)和句子中的句法约束,本研究解决了当前扩散模型在图像中正确绑定文本提及的属性到正确对象上的困难,并在多个数据集上展示了图像与文本之间的对齐领域的重大改进。