Jul, 2024

探索基于短语分时的文本至图像扩散模型

TL;DR通过扩展扩散模型的架构,本研究提出了一种使用提问学习的方法,实现了基于句子构建的图像理解,进而在零样例的情况下实现了上下文感知的短语级理解,证明了扩散模型在语境感知的短语级理解方面的能力。