Jan, 2024

aMUSEd:一个开放的 MUSE 复现

TL;DR通过实验证明 MUSEd 的有效性,它是一种开源、轻量级的遮蔽图像模型(MIM),用于文本到图像的生成,相对于潜在扩散(latent diffusion)方法,MIM 在推理步骤上更少且更具可解释性,同时可以通过仅有一张图像进行附加风格的微调。