May, 2023

FastComposer:无需调参的基于局部注意力的多主体图像生成

TL;DRFastComposer 使用图像编码器提取的主题嵌入来增强扩散模型中的通用文本调节,从而实现了高效的个性化、多主题文本到图像的生成。 FastComposer 通过跨注意力本地化监督和延迟立体雕塑来处理多主题生成中的身份混合问题,并且相对于基于微调的方法获得了数百到数千倍的加速。