Jun, 2024

一种统一的框架用于整合 LLMs、知识图谱和可控扩散模型的一致性图像生成(PCIG)

TL;DR通过引入一种基于扩散的新框架,本研究解决了现有文本生成图像模型在生成图像时与输入文本不一致的问题,通过对不一致现象进行细致分析和分类,并利用先进的语言模型提取对象、构建知识图谱,结合图像生成模型进行了准确一致的图像生成实验。