Jun, 2024

SyncNoise: 文本驱动的三维场景编辑中的几何一致噪声预测

TL;DR基于 2D 扩散模型的视觉编辑已经取得了显著的能力,但如何在多个视角上实现一致的编辑仍然是一个挑战。本文提出了 SyncNoise,一种新颖的几何引导的多视角一致噪声编辑方法,通过同步编辑多个视角以强制实现几何一致性,从而确保了语义结构和低频外观的全局一致性。通过设置一组锚定视角和跨视角重投影将其传播到相邻帧,以进一步提升高频细节的局部一致性。通过训练期间引入深度监督来提高多视角对应的可靠性,并在噪声和像素级别上增强几何一致性,我们的方法实现了高质量的 3D 编辑结果,尤其是在具有复杂纹理的场景中。