Jun, 2024

Ouroboros3D: 图像到三维生成的三维感知递归扩散

TL;DR现有的单图像到 3D 生成方法通常涉及两个阶段的过程,首先生成多视图图像,然后使用这些图像进行 3D 重建。然而,分别训练这两个阶段会导致推理阶段的数据偏差,从而影响重建结果的质量。我们引入了一个统一的 3D 生成框架,命名为 Ouroboros3D,它将基于扩散的多视图图像生成和 3D 重建集成到递归扩散过程中。在我们的框架中,通过自我条件机制联合训练这两个模块,使它们能够适应彼此的特征以进行稳健的推理。在多视图去噪过程中,多视图扩散模型使用由重建模块在上一时间步骤渲染的具有 3D 感知的地图作为附加条件。具有 3D 感知反馈的递归扩散框架统一了整个过程并改进了几何一致性。实验证明,我们的框架优于将这两个阶段分离和将它们合并在推理阶段的现有方法。