Jan, 2024

StyleInject:文本到图像扩散模型的参数高效调优

TL;DR通过引入StyleInject,一种针对文本到图像模型的特殊微调方法,以对抗传统的LoRA方法在图像生成方面的不足,我们能够显著减小对原始模型的文本-图像对齐能力的影响,同时能够在转移学习中灵活地适应不同风格,通过大量实验证明StyleInject在文本-图像语义一致性和人工评估方面超越传统方法,并在参数效率上有所提升。