Jun, 2023

潜在扩散模型中的场景表示:超越表面统计

TL;DR本文研究了潜在扩散模型在产生逼真图像时的内在机制,通过使用线性探针发现,LDM的内部激活编码了简单场景的几何和显著对象/背景区别的线性表示,并且这些表示出现在去噪处理的早期阶段,对LDM图像合成具有因果作用,并可用于简单的高级编辑。