Sep, 2023

StyleAdapter:一种适用于风格化图像生成的单通道无 LORA 模型

TL;DR该研究提出了一种无需 LoRA 的方法,用于风格化图像生成,通过使用文本提示和风格参考图像作为输入,以单次传递生成输出图像。使用统一模型,该方法能够适应多种风格,但面临两个挑战:1)提示在生成内容上失去可控性,2)输出图像同时继承了风格参考图像的语义和风格特征,从而损害其内容的保真度。为解决这些挑战,作者提出了 StyleAdapter,该模型由两个组件组成:双路径交叉注意力模块(TPCA)和三个解耦策略。这些组件使模型能够分别处理提示和风格参考特征,并减少风格参考中语义和风格信息之间的强耦合。StyleAdapter 能够以单次传递生成与提示内容匹配且采用参考的风格的高质量图像,相比以前的方法更灵活高效。实验证明了我们方法的优越性。