Mar, 2024

ECNet: 有效可控的文本到图像扩散模型

TL;DR通过引入 Spatial Guidance Injector(SGI)和 Diffusion Consistency Loss(DCL)方法,我们提出了一种更准确的可控端到端文本到图像生成框架,其中 SGI 提供了更准确的条件输入,DCL 加强了对生成输出的控制,实验证明了我们方法在各种条件下显著提升了生成图像的可控性和稳健性,优于现有最先进的可控文本到图像模型。