Jan, 2023

Muse: 通过 Masked 生成变压器实现文本到图像生成

TL;DRMuse 是一种基于遮蔽建模任务在离散令牌空间中训练的文本到图像 Transformer 模型,借助预训练的大型语言模型,实现了高度还原原始文本意图的图像生成能力,同时也能够直接应用于图像编辑等任务。