Nov, 2023

视觉变幻图:利用扩散模型生成多视角视错觉

TL;DR利用现成的文本到图像扩散模型,我们提出了一种简单的零通道方法来合成多视角光学幻象。经过逆扩散的过程中,我们估计了噪声并结合这些噪声估计对图像进行去噪。理论分析表明,该方法适用于能够被写成正交变换的视角,其中包括置换。这引出了视觉易位的概念 —— 一种在像素重新排列下会改变外观的图像。此方法还自然地扩展到具有多于两个视角的幻象。通过定性和定量的实验结果,我们展示了该方法的有效性和灵活性。