Oct, 2024
DART:用于可扩展文本到图像生成的去噪自回归变压器
DART: Denoising Autoregressive Transformer for Scalable Text-to-Image
Generation
TL;DR 本研究解决了传统扩散模型在训练和推理过程中由于马尔可夫特性所带来的效率问题。提出的DART模型通过非马尔可夫框架,将自回归和扩散模型结合,使图像补丁的迭代去噪更加高效,并在处理文本和图像数据上表现出卓越的性能。DART为可扩展的高质量图像合成设定了新的基准。