Sep, 2022

潜在扩散模型下的创意绘画

TL;DR本研究采用基于自编码器的后向扩散模型和交叉注意力增强的 U-Net 来实现压缩潜在空间的图像生成,扩展了 LDMs 的创意绘画能力,包括文本条件扩展和模型重新训练,该方法使用 Wikiart 数据集进行新颖的绘画生成​​,并通过与原模型的直接比较表明创造力和艺术性得到了丰富的提高。