Jun, 2023

Wuerstchen:文本到图像模型的高效预训练

TL;DR介绍了一种新颖的文本到图像合成技术 Wuerstchen,它在有限的硬件资源下实现了竞争性能和无前例的成本效益和易训练性。该方法利用最近机器学习的进展,在强潜在图像压缩率上采用潜在扩散策略,可显著降低计算负担,同时保留或提高所生成图像的质量,为实时应用提供了可行性。与最先进的模型相比,Wuerstchen 具有显著的推理速度改进,并且仅需 9200 GPU 小时的有限训练成本,能够大幅降低一般成本且不影响最终性能。通过 Wuerstchen,我们在文本到图像合成领域向前迈出了一大步,并为未来研究提供了一种创新的探索路径,从而将 AI 技术的应用民主化