BriefGPT.xyz
Ask
alpha
关键词
u-net backbone
搜索结果 - 1
康定斯基 3.0 技术报告
Kandinsky 3.0 是一种基于潜在扩散的大规模文本到图像生成模型,通过两倍更大的 U-Net 主干网、十倍更大的文本编码器和去除扩散映射等关键组件的改进,取得了与其他模型相比更高质量和真实感的图像生成效果。
PDF
7 months ago
Prev
Next