Mar, 2024
CogView3:通过中继扩散实现更精细和更快速的文本到图像生成
CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion
Wendi Zheng, Jiayan Teng, Zhuoyi Yang, Weihan Wang, Jidong Chen...
TL;DRCogView3 是一种基于级联框架的文本到图像生成模型,通过实现中继扩散和超分辨率技术来提升性能,在人工评估中比当前开源文本到图像扩散模型 SDXL 表现优秀 77.0%,同时只需约 1/2 的推理时间。