Dec, 2023

康定斯基 3.0 技术报告

TL;DRKandinsky 3.0 是一种基于潜在扩散的大规模文本到图像生成模型,通过两倍更大的 U-Net 主干网、十倍更大的文本编码器和去除扩散映射等关键组件的改进,取得了与其他模型相比更高质量和真实感的图像生成效果。