Apr, 2024

TheaterGen: 使用 LLM 进行一致多轮场景角色管理的图像生成

TL;DRTheaterGen 是一个无需训练的框架,通过将大型语言模型(LLMs)和文本到图像(T2I)模型集成,实现了多回合图像生成。该框架通过 LLMs 生成和管理一个标准化的提示书,从而提高合成图像的语义一致性和上下文一致性。通过将提示书和指导信息结合到 T2I 扩散模型的反降噪过程中,TheaterGen 生成最终的图像,从而大大提升了合成图像的质量。