May, 2024

FlexEControl: 文本到图像生成的灵活高效多模控制

TL;DR提出了一种新颖的灵活高效的可控文本到图像生成方法 FlexEControl,其核心是一种独特的权重分解策略,能够有效地整合不同类型的输入,提高了生成图像与控制之间的准确性,同时显著降低了与多模态条件相关的计算开销。相比 Uni-ControlNet,该方法在可训练参数和内存使用方面分别减少了 41% 和 30%,且能够灵活生成在多种输入条件下引导的图像。