Oct, 2023

Kandinsky:带有图像先验和潜在扩散的改进文本到图像合成

TL;DRKandinsky1 是一种使用潜在扩散架构的文本到图像生成模型,与图像先验模型的原则结合,并通过修改的 MoVQ 实现作为图像自编码器组件,支持多样化的生成模式,有 8.03 的 FID 得分和可测量的图像生成质量。