Apr, 2022

CogView2:采用分层 Transformer 技术的更快更好的文本到图像生成

TL;DR本文提出了基于分层 Transformer 和本地并行自回归生成的解决方案,使用一个简单灵活的自监督任务 CogLM 进行预训练,并将其用于快速超分辨率。新的文本到图像系统 CogView2 相对于最先进的 DALL-E-2 具有非常优异的生成能力,并自然支持图像文本引导编辑。