Apr, 2024

通过细分和双重绑定实现任何艺术风格的文本到图像合成

TL;DR该研究论文介绍了一种名为 Single-StyleForge 的新方法,用于将预训练的文本到图像扩散模型进行个性化训练,从文本提示中生成指定风格的多样化图像。此外,研究还提出了一种名为 Multi-StyleForge 的改进方法,通过学习多个标记来改善风格和文本 - 图像对齐的质量,在六种不同的艺术风格上实验评估表明,在生成的图像质量和感知保真度指标(如 FID、KID 和 CLIP 分数)方面取得了显着的改善。