Jun, 2024

LLM4GEN:利用语义表示的 LLM 用于文本到图像生成

TL;DRLLM4GEN 通过结合 LLMs 特征设计的 Cross-Adapter 模块,有效提高了复杂和密集提示的语义理解能力,为 text-to-image 生成任务带来了显著改进,并在 sample 质量、图像文本对齐和人工评估方面超越了现有的最先进模型。