May, 2023

SUR-adapter:使用大型语言模型增强文本到图像预训练扩散模型

TL;DR该研究探讨了如何改进文本生成图像的模型的问题,提出了一种称为 Semantic Understanding and Reasoning adapter (SUR-adapter) 的参数高效微调方法,以提高短文本输入的语义理解和常识推理能力,进而用提高的文本语义表征生成高质量图像。