Jan, 2024

PIXART-δ: 快速且可控的图像生成与潜在一致性模型

TL;DR通过将 Latent Consistency Model(LCM)和 ControlNet 集成到先进的 PIXART-α 模型中,本技术报告介绍了 PIXART-δ,一个文本到图像综合框架。PIXART-δ 结合了 LCM,显著提高了推断速度,在仅 2-4 步就可以生成高质量图像。此外,PIXART-δ 还通过引入类似 ControlNet 的模块,实现了对文本到图像扩散模型的细粒度控制。作为一种先进、开源的图像生成模型,PIXART-δ 对于文本到图像综合提供了一个有前途的选择,显著提升了其可用性和易用性。