Aug, 2023

SGDiff:时尚合成的风格引导扩散模型

TL;DR本文介绍了一种创新的样式引导扩散模型 (SGDiff),它结合了图像模态和预训练的文本到图像扩散模型,以促进创意时尚图像合成。它通过混合补充样式引导克服了文本到图像扩散模型的局限性,大大降低了训练成本,并解决了仅依靠文本输入来控制合成样式的困难。本文还引入了一个新的数据集 - SG-Fashion,专门为时尚图像合成应用设计,提供高分辨率图像和广泛的服装类别。通过全面的削减研究,我们考察了无分类器引导方法在各种条件下的应用,并验证了该模型在生成所需类别、产品属性和样式的时尚图像方面的有效性。本文的贡献包括一种新颖的无分类器引导多模态特征融合方法,为时尚图像合成应用提供了全面的数据集,对条件文本到图像合成进行了深入研究,并为将来在文本到图像合成领域的研究提供了有价值的见解。代码和数据集可在以下链接获取:https://github.com/taited/SGDiff。