Dec, 2023

KOALA:自注意力在潜在扩散模型知识蒸馏中的重要性 —— 用于高效内存和快速图像合成

TL;DR通过蒸馏 SDXL 模型的知识,我们提出了一种高效的文本到图像综合的潜在扩散模型,其核心是通过设计有效的 U-Net 和自注意力的知识蒸馏策略,使 KOALA 模型在减小模型尺寸的同时,仍保持良好的生成质量,相较于 SDXL 模型有两倍以上的速度,可以在资源有限的环境中成为一种具有成本效益的替代选择。