BriefGPT.xyz
大模型
Ask
alpha
关键词
text-driven and subject-driven image generation
搜索结果 - 1
UNIMO-G:基于多模态条件扩散的统一图像生成
UNIMO-G 是一个简单的多模态条件扩散框架,能够对多模态提示进行操作,并展示了文本驱动和主体驱动图像生成的统一能力。该框架通过训练大规模文本 - 图像对,以及使用多模态提示进行指导微调,实现了高保真度的图像生成。
PDF
5 months ago
Prev
Next