Dec, 2023

文本图像扩散模型中的交互控制

TL;DR在这项工作中,我们研究了使用人物-物体交互信息对文本到图像扩散模型进行条件控制的问题,并提出了一种可插拔的交互控制模型,通过交互嵌入来学习人物-物体交互信息,并通过条件自注意层更好地对现有的文本到图像扩散模型进行调节,从而在HOI检测得分、FID和KID方面明显优于现有的基准模型。