Jan, 2024

UNIMO-G:基于多模态条件扩散的统一图像生成

TL;DRUNIMO-G 是一个简单的多模态条件扩散框架,能够对多模态提示进行操作,并展示了文本驱动和主体驱动图像生成的统一能力。该框架通过训练大规模文本 - 图像对,以及使用多模态提示进行指导微调,实现了高保真度的图像生成。