Jun, 2024

MS-Diffusion:基于布局引导的多主体零样本图像个性化

TL;DR我们的研究引入了 MS-Diffusion 框架,用于基于布局指导的零样本图像个性化处理多主题,融合了引用令牌和特征重采样以保持细节的准确性,并通过跨主题注意力来实现各自主题条件对特定区域的影响,通过全面的定量和定性实验,证明该方法在图像和文本的准确性方面优于现有模型,推动个性化的文本到图像生成的发展。