Mar, 2024

CogView3:通过中继扩散实现更精细和更快速的文本到图像生成

TL;DRCogView3 是一种基于级联框架的文本到图像生成模型,通过实现中继扩散和超分辨率技术来提升性能,在人工评估中比当前开源文本到图像扩散模型 SDXL 表现优秀 77.0%,同时只需约 1/2 的推理时间。