Nov, 2022

薛定谔的蝙蝠:扩散模型有时会在叠加态中生成多义词

TL;DR本文使用类似稳定扩散模型 (Stable Diffusion model) 和 CLIP 编码器来解释文本到图像扩散模型在生成带有多重意义词汇的描述时所展现的奇特行为,两种方法均为通过对词汇向量的线性变化使生成的图像更加明确地反映所需的含义。