Mar, 2024

StereoDiffusion:基于潜在扩散模型的无训练立体图像生成

TL;DR为满足多种 XR 设备的需求,我们介绍了一种名为 StereoDiffusion 的方法,该方法与传统的修复流程不同,无需训练即可轻松使用,并与原始的 Stable Diffusion 模型完美集成。我们的方法通过修改潜变量,能够快速生成立体图像对,无需微调模型权重或对图像进行后处理。使用原始输入生成左图像并为其估计视差图,我们通过 Stereo Pixel Shift 操作生成右图像的潜向量,同时辅以 Symmetric Pixel Shift Masking Denoise 和 Self-Attention Layers Modification 方法,将右图像与左图像对齐。此外,我们提出的方法在整个立体生成过程中保持了高水平的图像质量,在各种定量评估中取得了最先进的成绩。