Feb, 2024

MuLan: 多模态-LLM进化多对象扩散智能体

TL;DR通过渐进式多对象生成、规划和反馈控制,我们开发了一种无需训练的多模态语言模型代理(MuLan),以解决现有文本到图像模型在处理多对象、对象空间位置、相对大小、重叠和属性绑定方面的困难。